【データサイエンス学部 座談会】
現象を数理モデル化する力は、社会のあらゆる場面で強みになる!
(プロフィール)
データサイエンス学部長 山崎眞見教授(左)
大学院データサイエンス研究科データサイエンス専攻 博士前期課程修了 上矢莉子さん(中央)
大学院データサイエンス研究科データサイエンス専攻 博士前期課程修了 小檜山祥央さん(右)
2018年3月に開設されたデータサイエンス学部も2024年4月に7年目を迎えます。この3月には、第1期生が大学院修士課程を修了して、社会に羽ばたくことになりました。そこで、第1期生として入学した上矢莉子さん、小檜山祥央さんに、学部長の山崎眞見教授と一緒にデータサイエンス学部の6年間を振り返ってもらうと普段はあまり語られない学びの魅力や将来の可能性が見えてきました。
データを使って社会に新たな価値を提供する
——まず、山崎先生から横浜市立大学データサイエンス学部の概要について、教えていただけますか?
山崎 「データサイエンス」の基礎的なスキルを身につけられる学部です。具体的には、統計学、統計分析、大規模データ処理プログラミング、機械学習モデルの構築などに挑戦します。研究テーマは幅広くて、主にヘルス(健康・医療)、ビジネス、アーバン(都市)、ソーシャル(社会)という分野に分かれています。例えば、GIS(Geographic Information System)と呼ばれる地理情報システムを使った研究を行う先生もいれば、アンケート調査設計を専門とする先生もいます。
高校生の皆さんに伝えているのは、ここは理工学部の情報科学科ではないということです。プログラミングの原理を学ぶのではなく、データを使って社会に新たな価値を提供するソリューションを考えることを主眼としています。先輩の研究テーマを聞くとイメージしやすいかもしれませんね。
上矢 はい。私は、企業と共同で、ベビーケアルームの需要を調べて、マーケティングに活かす研究に取り組みました。ベビーケアルームは、乳児のおむつ替えや授乳をするためのスペースで、その企業では、ショッピングセンターや駅、行政機関の建物などに設置できる個室のユニットを販売しています。私は対象となる施設ごとの人流データや、企業から提供していただいたベビーケアルームの利用時間に関するデータを分析して、実際にどのくらいの需要があるか調べて、指標化しました。
小檜山 私が取り組んだのは、データ分析というよりAI(人工知能)研究に近いですね。皆さんもご存じのChatGPTに代表される生成AIは、Transformerと呼ばれる深層学習モデルが基盤となっています。これはGoogleの研究者が開発したモデルで、現在、世に出ているほとんどのテキスト生成AIや画像生成AIに使われています。私は、世界を変えると言われている生成AIを支えるTransformerが、どうすごいのか自分なりに仮説を立てて調べました。
データは企業の強力なマーケティングツールになる
山崎 深層学習は、いわゆる「ディープラーニング」と呼ばれる機械学習の一分野で、コンピュータが自動で大量のデータから共通する特徴などを抽出することができる仕組みです。現在、自動運転システムや創薬など、さまざまな分野で応用されていますね。小檜山さんは、具体的にはどういう研究をしたんですか?
小檜山 話し出すとかなり複雑になるのですが……簡単に言うと生成モデルに使用されるTransformerという機構を含むモデルを、言語用と画像用で二つ用意し両者に同じ四則演算の数式を与えて、どちらがよりその本質を理解しているかを数値化しました。数式といっても入力は文字ベースなので、言語モデルがより精度が高くなると思ったのですが、意外なことに画像モデルのほうがわずかですが高い成果を上げました。
そもそも生成AIというのは、予め学習した大量のデータを基に与えられたテーマに対して、“それらしい”テキストや画像を予測して出力する深層学習モデルです。当然ながら、言語モデルはテキスト、画像モデルは画像に特化していると思いますよね? ところが、画像モデルのほうが入力したテキストをよく理解しているという結論になりました。そこから生成AIは、人間とは異なる世界認識をしていることが少し見えてきましたね。
上矢 面白そうですね!私も画像生成AIには、かなり興味があります。
山崎 上矢さんは、研究からどのようなことがわかりましたか?
上矢 ベビーケアルームの事業を定量化、つまり「見える化」できたことで、現在の設備数で足りているかが明確になり、企業の方にも喜んでもらうことができました。企業としては、この施設にはこれだけの人流があって、これだけの利用ニーズがあるということをデータで示せることで、強力なマーケティングツールになるわけです。データから価値を見出して、ビジネスに応用する事例を現場で学べたことになります。個人的には、子育ての経験がないので、ショッピングモールなどでのベビーケアルームのニーズをデータからリアルに知ることができたことも大きな発見でした。
プログラミング経験ゼロからのスタート
——ちなみに、先輩のおふたりがデータサイエンス学部を目指したきっかけは?
上矢 高校でデータサイエンス学部のパンフレットを見て、「こういう学部があるんだ〜」と興味を持ちました。もともと私は数学が好きで、数学科の教員になりたいと思っていたんです。私が入学した当時は、データサイエンス学部に数学科の教職課程があって、それも決め手になりましたね。教職をとりながら、情報系を学べば、将来が広がりそうだな……と。結局、教員の道ではなく、企業への就職を選びました。
※現在の横浜市立大学データサイエンス学部には、数学科の教職課程はありません。
小檜山 私も母親がもらってきた学部パンフレットで知りましたね。もともと組み立て工作などのものづくりが好きだったところに、ITブームもあって、プログラミングって楽しそうだなぁと思っていたんです。そんなタイミングで、データサイエンス学部のパンフレットを見て、ここならプログラミングもできそうだなと思って志望しました。もともと工学部志望だったのですが、横浜市立大学が実家から近かったので、ここでもいいかなと(笑)。
山崎 ふたりはプログラミングの経験はありましたか?
上矢 私はないです。情報の授業で、Excelの表計算などをしたくらいです。
小檜山 実は私もまったくで……。興味はあったのですが、Webサイトとかもつくったことはなかったです。
プログラミング言語Pythonを使ってデータ分析
——プログラミング経験ゼロからでも大丈夫!というのは勇気づけられますが、入学後はどんな授業が待っているんですか?
小檜山 1年次は、統計学や線形代数などの数学科目が中心でしたね。その当時は、これがデータサイエンスの何に役立つのかよくわからないまま数学の課題を解いてました。
上矢 私も必修科目だし、高校で習った部分もあるなと思いながら 、淡々と数学の授業を受けていました。プログラミングの授業が始まるのは、2年次からですね。Python(パイソン)というプログラミング言語のモジュールを使って、データ分析に挑戦しました。
山崎 少し補足すると「モジュール」というのは、専門家が予めデータ分析用につくったソースコードを誰でも使いやすいようにまとめたものと考えてください。Pythonにはこうしたモジュールがたくさんあって、これが評価されて世界中で利用されているわけです。ひとつのモジュールごとに何十万人というコミュニティがあって、日々、改良が繰り返されています。
小檜山 2年生の頃は、そんなことはまったく知らず、Pythonを使ってましたね。演習科目でPythonのプログラムを動かして、エラーが出る度に手を挙げて、先生に聞いてました。
山崎 そんな学生と教員の距離感は横浜市立大学データサイエンス学部の魅力ですよね。ただ、上矢さんも小檜山さんも第1期生ということで、私たち教員も張り切って、かなり難しい課題に挑戦させていたんです……実は(笑)。
時代に合わせてカリキュラムも更新中
——上矢さんは山崎先生の研究室に所属しているということですが、先生は学部時代の上矢さんをどうご覧になっていましたか?
山崎 上矢さんは、WiDS(Woman in Data Science/ウィズ)というスタンフォード大学の呼びかけて始まったデータサイエンスの啓蒙プログラムで、アイデアソン(ITサービスのアイデアを競う大会)を実施した際の記念すべき初代優勝者だったのをよく覚えています。その後は、3年次の「ビッグデータ解析」の実習でも積極的に質問してきたので、熱心な学生だなと思っていましたよ。
上矢 「ビッグデータ解析」では、Pythonを使ってワードクラウド(単語を並べて表示する技法)をつくる課題に挑戦したのですが、ぜんぜんうまくいかなくて……。よくあの状態から企業との共同研究ができるまでに成長できたと自分でも思います。
山崎 企業との共同研究で発見したことはありますか?
上矢 研究をする前は、1対1で企業の方と話した経験なんてなかったので、最初はとにかく緊張しました。最終的には、企業の方の前で、分析結果のプレゼンテーションまでできるようになって、大きな自信になりましたね。
山崎 データサイエンス学部では、企業との連携をかなり重視しています。授業でもデータサイエンスに携わる企業や官公庁の担当者を招いて講演をしていただく「データサイエンスセミナー」を開講しています。また、学部3年次には、企業と連携したPBL(Project Based Learning/課題解決型)の演習科目も用意しています。多くの学生はここでの成果を卒業研究につなげていきます。私も日立製作所に勤務していた経験があるのですが、企業出身の教員も複数います。
小檜山 私の研究室の担当教員である越仲孝文先生もNEC(日本電気)で長く働いていた経験があり、それが研究室所属の決め手になりました。先生の専門が知能情報学だったので、ここならAI系の研究ができるかなと考えました。私が大学院の修士1年になった2022年の夏から冬にかけて、生成AIの大ブームがやってきて、とにかく楽しかったのですが、変化が速すぎ研究テーマを決めきれず、相談に相談を重ねて、やっと先ほど話したTransformerの研究にたどり着きました。
山崎 データサイエンスの研究は、変化が速いので、教員も一緒に勉強しているというのが実状です。2018年に学部を開設し無事完成年度(2021)を迎えるとすぐに、カリキュラムを改訂しました。研究テーマがどんどん変わっていくのも自然なことなのです。ただ、大学にはChatGPTのような大規模言語モデルをゼロから開発するような莫大な予算も計算リソースもありません。では、大学ならではの研究領域とは何か……。教員も含め、それを常に考えながら独自の研究を進めています。
重要なのは「自分で学び、自分で成長する力」
——小檜山さんは、入学時と比べて自分が成長したなと実感することはありますか?
小檜山 プログラムが動かなくてもすぐに先生を呼んで解決することはなくなりましたね(笑)。文献やGoogle検索で調べて、自分で解決できるようになったのは、大きな進歩だと思います。
山崎 実はこれが大切なんです。大学でカリキュラム通り授業を受けて、卒業できればデータサイエンスのエキスパートになれるわけではないんです。この分野は、学ぶべき知識もどんどんアップデートされます。そのため自分で学び、自分で成長する力を養うことが大学の意義だと思っています。最新のプログラミング言語は、独学でも身につけられます。卒業後も自分で学び続け、それを楽しめる人になってほしいですね。
——改めて、おふたりは、横浜市立大学データサイエンス学部の魅力はどのような点にあると思いますか?
上矢 興味を持てる分野が広いことですかね。ビジネスはもちろん、マーケティング、教育、医療、子育てまで幅広いテーマに取り組めるのがデータサイエンスの魅力だと思います。女子が興味を持ちやすいテーマも多いですよね。私も数学や統計学に興味を持ちながら、画像解析なども面白そうだなと思っていたので、幅広い分野に興味がある人に向いていると思いますね。
小檜山 先ほど山崎先生もおっしゃっていましたが企業と連携した授業が多いのが横浜市立大学データサイエンス学部の魅力だと思います。私も3年次の「PBL演習」で、台湾のIT企業でインターンシップを経験して、グローバルな仕事を実感できました。当時はまだオンラインでの実習だったのですが、先方の社内共用語が英語で、コミュニケーションに苦労しました。これからのIT業界では、プログラミングのスキルだけでなく、英語のスキルも強みになるのがよくわかりました。
山崎 横浜市立大学はもともと英語教育に力を入れていて、留学制度も充実しています。その点で、将来グローバル企業で働きたいという学生にも向いていますよね。また、横浜市立大学には医学部があるのも特色です。データサイエンスは健康・医療分野と非常に相性がいいんです。今後は医学部との共同研究にも力を入れていきたいですね。
上矢 山崎先生の学生時代もインターンシップってありましたか?
山崎 約40年前になりますが、似たものがありました。私も学部3年次にソニーの開発部で3週間ほど研修する機会があって、すごく刺激になったのを覚えています。その体験を学生たちにもしてほしいと思って、一生懸命「PBL実習」の提携企業を探しているんですよ!
生涯学び続けられる人材になるのが目標!
——学生おふたりの将来の目標を教えてください。
上矢 私はIT企業のNECソリューションイノベータで、システムエンジニアとして働くことが決まっています。お客様の課題をヒアリングして、それを解決するシステムを開発する仕事です。技術の発展が目まぐるしい分野なので、学生時代の経験を活かして、生涯学び続けられる人材になるのが目標です!
小檜山 私はNTTドコモのデータサイエンス部門で、顧客データ分析などの仕事に就くことが決まりました。まさにデータサイエンスの知識と技術を活かせる仕事です。就職はゴールではなく、スタートラインです。幅広い仕事を経験して、データサイエンス分野のゼネラリストになりたいと思っています。
山崎 ふたりは、横浜市立大学データサイエンス学部の第1期生で、大学院修士課程を修了して社会に出る第1世代になります。おそらく社会からの期待値も高く、それに応えるのは大変でしょう。それでも、ここで身につけた「社会の営みを科学的に見る力」は、多くの企業で高く評価されると思います。
データサイエンスとは、社会のあらゆる現象を数理モデル化して、価値を見出す学問です。流行りの学問分野と思われがちですが、科学的な視点を得るための実に普遍的な学問です。学生たちがここで身につけた力は、社会がどんなに変化しても揺るがない確かな強みになるでしょう。
(2024/03/27) 広報課