YCU 横浜市立大学
search

【行政課題解決 PBL】2019年度 前期 最終講義

新時代のデータサイエンティスト育成に向けて!

横浜市立大学・東京理科大学・明治大学の3大学共同で実施される文理融合・実課題解決型データサイエンティスト育成事業「YOKOHAMA D-STEP」。その中の講義のひとつ【行政課題解決PBL(2019年度・前期日程)】は7月26日(金)に最終講義を実施。受講生35名は5グループに分かれて、これまでの講義やEラーニングで得た知識や手法をもとに事前に提示された共通の課題に取り組み、その解決手法をコンペティション形式で発表しました。

事前に提示された課題は架空の自治体(A市)がクライアントとなり、滞納され未回収となっている市民税を10%削減する方法の提案を求めました。

<課題詳細>
A市が未回収の市民税を集めるためには?

A市には滞納され未回収となっている市民税が約54億円ある。納付期限までに振込のなかった人には督促状を送り、さらに10日以上納付がなかった場合は職員が電話による催促をしている。滞納している人物が電話に応じた場合、その後の納付率は78%、未応答の場合は36%で、架電による督促は有効手段である。しかしながら、職員の人数には限りがあり架電回数をむやみに増やすことはできない。効率よく市民税を回収できる方法を提示してほしい。目標は滞納額を10%減らすことである。

各グループ発表前に、本講義の講師を務める田栗正隆准教授(横浜市立大学 データサイエンス学部)からイントロ説明が行われる


受講生たちに渡されたのは滞納者の年齢・性別・住居形態・世帯人数・督促電話への応答の結果をまとめた模擬データ。さらに督促の電話に応じた人はその後の納付率が高まること、架電できる時間帯や人員には限りがあることなどが伝えられ、与えられた条件から最適な提案をすることが求められました。

与えられた条件のなかから状況を分析し、課題解決のためにどのような提案ができるのかを考えてプレゼンテーションを展開。複雑な現象が絡み合う課題からデータを解析することで事象を読み解き、さまざまな観点から最適な提案方法を見出しました。

審査員には、データサイエンスを専門とする大学、行政機関及び民間企業の関係者(代表)らが参加。実際に課題に対する提案を受ける側として、あるいはデータサイエンスを取り扱う現場第一線の目線で審査・講評を行いました。

 

同じデータを使いつつも各グループは異なる提案を展開。白熱したコンペに!

各グループはいずれも、滞納者の属性と架電の最適なタイミングをデータサイエンスによって導き出すことに挑戦。ここで、特に評価の高かったグループの発表内容を紹介します。

〇 クライアントの要望に忠実かつわかりやすい提案をしたグループ1

グループ1は、わかりやすく公平な架電ルールをつくることを目標にデータ解析に着手。架電回数や業務の時間は変えないというクライアントの意向を再確認した上で提案を行いました。シンプルなルールづくりのため、架電のタイミングは曜日(月~金)と午前・午後の10個のマスに割り振り、架電対象にはコンセプト名をつけて把握しやすいように工夫。架電対象は10個のマスごとに決定木分析※1で応答しやすいグループを導き出し、架電の機会が公平になるように割り振りました。特に参加者の興味を引いたのは「異常滞納者」の項目。滞納者のなかには金額が異常な額に上る「異常滞納者」が存在し、不思議なことにその層にも応答率のよいタイミングがあることを発見しました。
導き出した応答率を決定木分析で使わなかったテストデータにあてはめて検証するシミュレーションも実施。その結果、目標到達実現は難しいものの、未回収額の削減は可能という結論に至りました。

(※1)決定木分析:樹形図のように属性の分岐により段階的にデータを分析する手法で、分類や予測に用いられる

〇 実直な分析・提案をしたグループ2

最初に発表を行ったグループ2は、架電をするタイミングについてマニュアルを作成し、電話の応答率を向上させることを考えました。電話に応答するタイミングは年代や性別といった属性によって異なることを発見し、ヒートマップを用いて電話に応答しやすい曜日・時間帯を見出したのです。
最終的には、ロジスティック回帰分析※2と決定木分析を用いて、架電する曜日・時間・対象(属性)を割り出し、一覧表にして提案。架電にモレがないようにフレキシブルに使える時間も考慮されていました。さらに実際にそのマニュアルを使えば回収が可能になるのかをシミュレーションすることで裏付けを実施。マニュアルを用いれば回収率は11%向上し、滞納金を回収できることを説明しました。

(※2)ロジスティック回帰分析:応答率のような確率を複数の要因で表現する手法で、分類や予測などに用いられる

〇「応答する人に似ている人」を見つけ出して確率を上げるグループ4

グループ4は、今後A市の職員が架電をする際に応答する確率が高い滞納者グループを割り出すことに挑戦。過去の架電結果から、性別・年代・世帯人数・住宅地の種類において、応答率が高い人と同じ傾向のある人を、それぞれの応答率の高い曜日・時間帯に割り振りました。また、効率が悪い「架電しない方がいい人」についても言及。費用対効果をシビアに考慮した提案を行いました。検証フェーズでは、昨年度の架電回数と同数回行った場合をシミュレーションし、無事に目標到達への道筋をつけました。
「架電をしない方がいい」条件と「応答率が高い」条件を兼ね備える人は「グレー」と称して括ったため「もっと踏み込んだスコアリングができたのでは」という指摘もありましたが、大胆な仮説のもと深部まで入り込んだ分析結果は概ね高評価を得ました。


その他のグループも講義の中で修得した解析手法や言語を用いて分析・加工を行い、なかには課題の前提条件から疑うユニークな内容のプレゼンもあり、会場が沸く瞬間もありました。それぞれのアプローチの違いから最終的な提案内容はそれぞれ大きく異なる結果となり、審査員たちを唸らせました。

サイエンスでありながら、ソリューションがひとつでないのがデータサイエンス

コンペティションで1位に選ばれたグループ1には、副賞が贈られました。

受講生たちのプレゼン力の高さに感心しきりだったという事業責任者の山中竹春教授(横浜市立大学 データサイエンス推進センター長)からは、閉会の辞として「実際にPBLにより学んでみると、ソリューションはひとつではないということがよくわかったと思います。データサイエンスはサイエンスでありながら、どんな情報解析をするのか・解釈をするのかで、行き着く先も変わってきます。統計学や情報学は、現場によって異なる条件を適応させてはじめて生きてくるものです」と述べ、新時代のデータサイエンティストへの道を歩み始めた受講生たちにエールを送りました。

「YOKOHAMA D-STEP」は引き続き2019年度・後期日程も開講予定です。詳しい日程・シラバス等は下記URLよりご確認ください。みなさまのご参加、お問い合わせをお待ちしています。

YCU・YOKOHAMA D-STEPページ:https://www.yokohama-cu.ac.jp/academics/ds/d-step.html
YOKOHAMA D-STEP 特設サイト:https://d-step.yokohama/

データサイエンス学部School of Data Science