HOSEI ONLINE「自由を生き抜く実践知」を体現する卒業生・研究者などを紹介するサイト

法政大学×読売新聞オンライン HOSEI ONLINE
  • 法政大学公式X(旧Twitter)
  • 法政大学公式Facebook
  • 法政大学公式line

広告 企画・制作 読売新聞社ビジネス局

データサイエンスを応用し、社会に役立つ数理モデルを探求する

作村 建紀専任講師作村 建紀専任講師

野球の打者の成績に関する数理モデルがコンペティションで受賞

廣瀬 本日は、理工学部経営システム工学科で統計科学の研究に従事する作村建紀先生をお招きしています。本学では、データサイエンスやAIを活用して、新しい価値を創造できる人材、持続可能な社会の構築に寄与できる人材を育成するため、全学部共通の「数理・データサイエンス・AIプログラム(MDAP: Mathematics, Data science and AI Program)」を開講しています。今年度は4,000人を超える学生が履修していることから、この分野への関心の高さがうかがえます。そこで、「2023年度スポーツデータサイエンスコンペティション野球部門入賞」を受賞し、本学で毎年実施している「学生が選ぶベストティーチャー賞」で2023年度に受賞された作村先生に、データサイエンスの魅力を伺いたいと思います。

作村 ありがとうございます。データサイエンスの導入として、ご紹介いただいた「スポーツデータサイエンスコンペティション野球部門」で取り組んだテーマについて紹介します。きっかけは、野球に詳しい研究室の学生から、打者の成績(ヒットやホームランなど)のデータを分析してみたいと相談を受けたことです。
野球では、打者がピッチャーの投げたボールに対して、ヒットやホームランを打ったらそれぞれ成功、凡打や三振でアウトになったら失敗とみなすことで、成功・失敗のデータが選手ごとにシーズンを通して得られます。実際は、打席ごとにピッチャーが異なりますし、打者本人の調子の波などのコンディションも当然違ってきます。そこでこうした成績に影響を与えると考えらえる要因をもとに、数理モデルを考えることで、打者やピッチャーの特徴から、最終的に成績を予測できるようにするということを目指しました。つまり、実際に観測されるデータが再現できるかというところまで検証しました。その結果、感覚的だった要因を数値化するという成果を得ることができました。

廣瀬 データサイエンスを「野球選手の調子の波」に応用した研究ということですね。スポーツ選手に調子の波があるということは、感覚的には多くの人が認識していると思いますが、この研究は実際に起こったデータを持って検証しながらサイエンスでそれを解明しようということになりますね。結果を左右しそうなさまざまな要素について、どんな風に作用しているか仮説をたて、実際のデータで検証していくことによって、ほぼ現実に近い「調子の波」が再現できるモデルを作ることを目指すわけですね。データサイエンスを応用することによって、他の事象についても、実際に起こったことと照らし合わせながら、その仮説が正しいかどうかを検証しながら、より正しい方向に修正していくことで、かなり現実を説明できるような数式が数理モデルとして出来上がるのですね。

作村 おっしゃる通りです。野球はサッカーなどの連続性のある競技と異なり、1球ごとにその結果を記録して確かめられるため、データとして扱いやすいという特徴がありました。データ量も膨大になるのですが、実際にこれを解析するという場面で統計学やデータサイエンスといった知識を生かすことができます。

学生の自由な発想がデータサイエンスの可能性を広げてくれる

廣瀬 野球のデータ分析は、作村先生の研究のメインテーマの応用になると思いますが、核となる研究分野についても伺えますか。

作村 私の研究のメインテーマは、実際に実データを扱ってモデルを作り出すといったものではなく、データからいかに正しく数理モデルを推定できるかといった推定手法のところになります。統計の基礎理論に近い、ベイズ推測という分野になります。それを応用して研究しているものとして、加速寿命試験、信頼性工学、適応型試験といった分野が挙げられます。例えば、加速寿命試験は、わかりやすく言うと、製品の平均寿命を知るための方法論です。機械やパソコンなどいつか必ず壊れる製品の耐久性を予測します。そうすることで、壊れる前にメンテナンスを行うなどして、寿命を延ばすことができます。
また、適応型試験は、例えばコンピューターで試験を行うと、1問ごとに回答結果が得られ、その結果によって、その人の能力に合わせた問題を次に出すことが可能です。このようにリアルタイムかつ、効率的に出題することで、正しい能力が推定できます。先ほどの野球の打者のデータ分析にもこの適応型試験が応用されています。
このようなデータに対する推定方法はたくさん考案されているのですが、その中で特に私がメインで研究しているのがベイズ推測です。これは、いま観測されているデータだけを考えて、そのデータの下で推定を行おうという考え方です。ビッグデータという言葉もありますが、膨大なデータであってもその中は多種多様なデータが混在しています。例えば自動車といっても、ガソリン車やハイブリッド車、電気自動車など多様です。そうすると、限られたデータの中で推定しなければならないのですが、ここにベイズ推測が非常にマッチするわけです。

適応型試験の一種である多段階試験における能力のベイズ推測の例.少ない項目数でも真の能力に近づく.

廣瀬 大学では大学院生や学部生の論文指導などもあり、研究室を構えるわけですが、そうなると普段研究している世界では出会わないような多様な学生に触れることになると思います。実際、学生と接することで得た気付きや興味深かった点などはありましたか?

作村 まさに先ほどの野球の話が該当します。基礎研究から応用研究まで行っているのですが、どうしても自分の興味関心がある分野に対象が絞られてしまいます。特にベイズ推測の研究では、数理的なところばかりを追いかけてしまうという状況に陥ってしまいます。そうすると、社会のどういう分野で自分の研究が役に立つのかが分からなくなることがあります。そんなとき、ゼミの学生が自由な発想でこんなデータ分析をしてみたいと言ってくれると、私の研究がマッチすることがあるんです。

数理統計の楽しさに触れられるよう授業の在り方を工夫

廣瀬 私自身、大学生の時、ある数学雑誌で、腕自慢の高校生たちが問題にチャレンジするコーナーがあり、その添削を行うアルバイトをするほど数学は好きだったのですが、どうしても統計における誤差の扱いにひっかかり、この分野には苦手意識を持ってしまいました。未だそこから脱却できていないような気もしますが、それでもデータサイエンスは実社会に役立つことは間違いなく、避けて通れないものになってきていると思います。

作村 そうですね。統計は数学とは少々違う雰囲気があります。時代とともにデータの在り方が変わると、統計自体の在り方も変わってきてしまいます。過去には関心のあった理論も今では使われてなかったりしますから。また、A=Bのように正確に証明できる数学とは異なり、統計の場合は、特に人にかかわるデータは、人の感情や行動などもあり、きれいなデータにならないことが多いため、イコールで結べなくなってしまいます。そうしたあやふやな印象を与えるため、数学は好きだけど、統計は苦手という方も多いようです。

廣瀬 こうした状況の中で、冒頭にMDAPを、大学全体で1学年6,600人が在籍している中で、今年度は4,000人超の学生が受講していると紹介しましたが、文系学生かつ数学が比較的苦手だと考えられる1・2年生に、統計やデータサイエンスについて教えることは難しい面もあるのではないかと思いますが、ベストティーチャー賞に輝いた作村先生はどのような工夫をされたのでしょうか。

作村 まずは数理統計の楽しさを知ってほしいと思っています。例えばあるデータを見せて、そのデータからこんなことが導き出せるのだけど、背後にはどんなメカニズムがあるのでしょうかという問いを立てて、正規分布などのデータを見せながら、最終的にこれは数式で表せるという流れで説明をしています。その中で、足りないことや社会との接点のような話もするようにしています。その上で、授業で分かったことや疑問に思ったことを提出してもらい、わかりにくかったという部分については資料にまとめて、次の授業の最初に共有しながら復習してもらうといった形で活用しています。また、自分たちが学んでいる数理というものが、どの程度社会で役に立つのかが分からないと思いますので、できるだけ演習問題を取り入れています。それもできる限り実際の社会で見られるようなキーワードやデータを織り交ぜる努力をしています。また、授業中に発言や質問がしやすいように、パソコンやスマホからオンラインで送信してもらい、その質問を学生全員でリアルタイムに共有できるような工夫もしています。

加速寿命試験の一種である Step-Stress 試験の数理モデルの例.電圧が上昇することで寿命が短縮される一方,電圧上昇ごとに部分的に回復することを考えたモデル.

様々なデータの背後にあるメカニズムを想像してほしい

廣瀬 文系の学生も、ゼミのプレゼンテーションやレポート、論文の作成時に、アンケート結果を分析しているケースが見受けられます。ただ、サンプル数も少なくその選び方にバイアスがかかってしまっていることが多々あります。ぜひ基礎的なデータの使い方についてアドバイスをいただけないでしょうか。

作村 確かに同じゼミの仲間内で収集したデータから導かれる推定結果はかなり偏っており、そのゼミの中では有用かもしれませんが、一般社会に貢献ができるデータかというとそうではありません。一方で、結果を導き出すまでにアプローチしたデータ収集の仕方や、モデルの考え方など、そのデータをモデルに適用して推定し、その推定した結果を分析して解釈もしくは考察するというプロセスを経験したことは有意義だと思っています。そのため、偏りのない一定数以上のデータを用いれば、より正しい結果を分析できると思います。そのため、もし興味があるテーマがあるのであれば、まず小さな規模でも良いのでデータを収集して、どう分析すればいいのかということを調べてみると良いと思います。平均を取ったり、分散を取ったりして終わりではなく、そのデータの背後にはどのようなメカニズムがあるのか想像すると良いでしょう。

廣瀬 MDAPを受講する学生が、こうした経験を通してデータ解析の重要性を認識してくれたらうれしいのですが、さらに多くの学生がこうした分野に関心を持つにはどういった視点を持てばいいでしょうか。

作村 関心を持てない学生の多くは、数学やプログラミングに苦手意識を持っていると思います。ただ実際にやってみるとイメージが変わると思います。実際目の前で起こっている現象について、普段はデータとかモデルとか意識しないと思いますが、簡単なモデルから考えてみればそれほど難しいものではありません。ニュースでも様々な統計を扱っていますが、平均値の他、中央値や最頻値、最小値、最大値など様々な見方があります。データの見方を変えることで、今後の生き方も変わってくると思いますので、好き嫌いをせずまずは触れてみてほしいと思います。

廣瀬 中高生時代に抱いた苦手意識から抜け出して、実際にチャレンジしてほしいですね。本日はありがとうございました。


法政大学 理工学部経営システム工学科専任講師 作村 建紀(さくむら たけのり)

福岡県大牟田市出身。九州工業大学大学院情報工学府博士後期課程修了。博士(情報工学)。中央大学理工学部助教を経て、2018年4月に法政大学に着任。専門は社会システム工学・安全システム、統計科学。研究テーマはベイズ推測、信頼性工学など。
主な論文に「製品の潜在的な稼働台数を考慮した消耗部品の需要予測」(共著、2024年、計算機統計学)、「Very Small Bias Observed in Bayesian Estimators even for Small Sample Sizes」(共著、2023年、Communications in Statistics - Simulation and Computation)。

法政大学総長 廣瀬 克哉(ひろせ かつや)

1958年奈良県生まれ。1981年東京大学法学部卒業。同大大学院法学政治学研究科修士課程修了後、1987年同大大学院法学政治学研究科博士課程単位取得退学、同年法学博士学位取得。1987年法政大学法学部助教授、1995年同教授、2014年より法政大学常務理事(2017年より副学長兼務)、2021年4月より総長。専門は行政学・公共政策学・地方自治。複数の自治体で情報公開条例・自治基本条例・議会基本条例などの制定を支援の他、情報公開審査会委員などを歴任。