真の文理融合をめざすAI・データサイエンス教育研究
樋口知之(ひぐち ともゆき)/理工学部教授
AI・データサイエンスセンター所長
パンデミック・シミュレーション
私が本原稿を執筆しているのは、新型コロナの患者数がやや減少に転じつつあるのではないかとメディア等で報道されている最中である(5月GW中)。すでに自宅からのオンライン授業も行っており、いわば生放送番組をすべて一人でこなすような、慣れないことをこなすだけでてんてこ舞の毎日である。同時に、SNSを含めた多様なメディアで報告される、さまざまな予測モデルにもとづく将来予想を冷静に判断しようとしている。
しばらく前我々の研究チームは、世界最大規模のパンデミック・シミュレーションを行い論文として報告したこともあり、私はパンデミックの予測モデルに関しては一定の知識と計算スキルがある。政府の専門家会議で大きな役割を果たされている西浦教授(北大)とも長年、共同研究プロジェクトや人材育成事業でお付き合いがある。興味のある方は、「パンデミック・シミュレーション」で検索すると我々のサイトがトップに表示されるので、ぜひ一読願いたい。
社会シミュレーション
パンデミック・シミュレーションは、シミュレーション分野においては社会シミュレーションと呼ばれる範疇に入り、自然科学でのシミュレーションと比較して大きな違いが二つある。まず、物理学分野等で実施されるシミュレーションのベースとなるモデルは、第一原理と呼ばれる支配方程式を出発点とするものである一方、社会シミュレーションは現象論的に記述された数式に立脚することが多い。対象を観察することで現象のダイナミクスを"抜粋"し、さまざまな支配方程式の構造を拝借して計算のための方程式を構成していく。SIRやSEIRモデルといった、疫学で100年以上利用されているモデルもそうである。そのため、抜粋する行為に客観性を持たせるためには、対象の観察結果であるデータを取得するプロセスを、明確かつ丁寧に構築することが欠かせない。つまり、シミュレーション時のデータ活用の策なくして現状に即した予測結果を得られないのが、社会シミュレーションの本質である。
もう一つの違いは、社会シミュレーションでは、人間の行動変容が基礎原理となる数式モデル自体にも影響を及ぼす点である。株価や為替のシミュレーションにはプレイヤー(エージェントとも呼ばれる)の行動変化が決定的に影響することが昔から人口に膾炙している。学術的にはゲーム理論として研究も多々なされている。一方、地球温暖化レベルの気候変動予測は別として、短期的時間スケールでの気象予報には人間の行動は全く関係ない。このように社会シミュレーションでは、人間の行為が数式モデルに直接的に関与する。言い換えれば、どんな社会にしたいのか、どんな未来を子供たちに託すのか、人間の意志決定のプロセスも数式モデルに内包させる必要がある。これらの自然科学分野でのシミュレーションとの違いを理解することにより、これからのAI社会に求められる人材像が浮き彫りになってくる。
ビッグデータとデータ駆動型研究
私は、AIやデータサイエンスと呼ばれる分野の数理および計算技術を専門としている。この分野に興味を持ったのは、私が大学院時代に直接体験した第二次AIブームの時になる。当時の電機メーカは、ニューロやファジーといった技術用語を冠した製品を各社競って世に送り出していた。そして、AIの技術レベルが産業界や一般の期待するレベルに達することなく、ブームは急速にしぼむ。私はその後一貫して、データから現象の振る舞いや機能を表現する数式モデルを帰納的に見いだす手法の開発と、その体系化に注力してきた。この基盤となっている理念はデータ駆動型推論であり、現在のAI技術の基盤となっている統計的機械学習はまさにデータ駆動型推論そのものである。
NHKの一般向け番組でも取り上げられるまで社会に浸透した深層学習(ディープラーニング)も、技術上は統計的機械学習の一例に過ぎない。統計的機械学習は、その数理モデルが内在する未知の変数(パラメータと言う)の数が膨大で、その膨大さでもってさまざまな現象の表現と多様なニーズへの対応を実現している。未知変数の決定のためには、当然、莫大なデータが必要であり、ビッグデータの登場無しには深層学習の成功もあり得なかった。そうすると、ビッグデータの効率的収集と効果的な情報サービスのためのシステム構築が、ビジネス上では枢要であることは明らかである。Google、Facebookが創業し、またAmazonが飛躍した2000年代初頭は、ビッグデータの登場による社会構造の変化を先読みした若者らが切り開いた新時代(ミレニアム)と言えよう。対照的にこの頃は、統計的機械学習の技術的にはゆっくりとした進歩であった。そうして2006年の深層学習の提案により、ビッグデータとデータ駆動型推論は、世界中の個人をターゲットする情報サービスの実現ツールとして、米国および中国企業に大成功を導いた。
人間中心のAI社会
データ駆動型推論は、AI社会を支える基盤技術である。その技術レベルは、第二次AIブームの時に産業界や一般の期待したものを現在遙かに凌駕し、AI技術主導によりあらゆる産業から日常生活にまで広範に大きな変革が起こりつつある。前述したように、統計的機械学習にはビッグデータが必須であるが、少なくともe-コマースやSNS上でビッグデータを生み出しているのは一般の個人であるため、米国のITメガ企業がビッグデータを活用して富を独占する傾向に厳しい目が向けられている。この現状は、当然、起こる(怒る?!)べきして起きた事態と言えよう。
ITメガ企業は、情報サービスを実現する"アルゴリズム"を内製化し、それをビッグデータによりミリ秒単位で更新している。まさに、社会シミュレーション技術を持ち、ビッグデータを通して社会を観察し、シミュレーションモデルを常に変化させている。前述したように社会シミュレーションでは、データを取得するプロセスとモデル修正への反映策が大きな意味を持つ。この視点から、ビッグデータ収集プロセスを厳格化する要請が、米国のメガIT企業に対して欧州の国々を中心になされた。通称、GDPRといわれる枠組みの成立である。
人間の行為が数式モデルに直接的に関与する点からも、社会シミュレーションとしてのITメガ企業のアルゴリズムおよび情報サービスに関して、今後の動きが見えてくる。社会には法律や社会規範から多くの制約があり、また人間としての倫理観から行動の幅に抑制もかかる。また宗教や文化といった国による価値観の違いも人間行動に多様な変化を生む。アルゴリズムが社会シミュレーションとして役割を持つ限り、社会の変化やプレイヤーの行為変容はアルゴリズムに反映されるべきである。AI技術が私たち社会生活に深く浸透しつつある今でこそ、技術主導ではなく「人間中心のAI社会」を私たちは創っていかねばならない。そのためには、社会のニーズや懸念などを可視化し、それらを実際のAIの技術開発(特にアルゴリズム)や関連する法制度などに反映させることは強く求められる。
文理融合とAI・データサイエンス教育
このように、「人間中心のAI社会」を創るには、AI技術の基本的仕組みを理解した上で、人文・社会科学の知識も備えた文理融合タイプの人材の貢献が重要である。今後のAI社会における人間の活躍の場の観点からは、AI技術に極めて優れた才能を発揮する人材の養成も大切だが、文理融合タイプの人材のほうがマスとしては期待が大きい。私自身、文理融合の言葉はあまり好きではないが、一般の方々にとって理解が進むのなら、あえて文理融合タイプの人材養成の大切さを謳っていきたい。
これからの「人間中心のAI社会」を創る主体は今の若者である。若い世代が持つ、シェアリングとエコシステムといった、譲り合いと協調を尊重する価値観こそ、地球規模の社会課題を解決する糸口となり得る。このような時代の要請に応えるべく、中央大学はその英知を集め、これまでにないスピード感でもって2020年4月にAI・データサイエンスセンターを設立した。本センターも、AIとデータサイエンスを活用して、課題を発見し問題解決することで社会の発展と人類の幸福に資する人材を輩出していく所存である。
樋口知之(ひぐち ともゆき)/理工学部教授
AI・データサイエンスセンター所長宮崎県出身。1961年生まれ。
1985年東京大学理学部卒業。
1987年東京大学大学院理学系研究科修士課程修了。
1989年東京大学大学院理学系研究科博士課程修了。同時に理学博士号取得。
同年、文部省統計数理研究所に助手として入所。その後、准教授、教授に昇任。
2011年より大学共同利用機関法人 情報・システム研究機構理事および統計数理研究所長。
2019年から中央大学理工学部教授。
日本学術会議の数理科学及び情報学分野の連携会員。一般社団法人データサイエンティスト協会理事。非常勤として、産業技術総合研究所人工知能研究センター研究顧問も務める。
専門はベイジアンモデリング。
主要著書に、『予測に生かす統計モデリングの基本』(<講談社>、2011年)、『データ同化入門』(<朝倉出版>、2011年)などがある。