コロナワクチンに関するツイートの感情分析
難波 英嗣(なんば ひでつぐ)/中央大学理工学部教授
専門分野 自然言語処理
人々の不安感とリスクコミュニケーション
新しいテクノロジーは、我々の生活を豊かにする反面、その新しさゆえに既存の知識では対応しきれない不確実性をはらむ。テクノロジーに限らず、自然災害や気候変動など、ひとは予測できない事態に対して不安を感じるものである。このような不安を解消するためには、その不安の要因に関する関係者間のリスクコミュニケーションが必要不可欠である。
例えば、新型コロナワクチンの場合における関係者とは、ワクチンを接種する一般市民、製薬会社、行政、専門家などを指す。市民の中にはワクチンの安全性について疑問を持つひともいるだろうし、接種券の配布方法について不満を抱えているひともいるだろう。こうした情報を把握し、専門家は人々にいかにわかりやすくワクチンの安全性などの情報を伝えるのか、ワクチン接種券の配布に関して人々が不満を抱えているのであれば、行政はその不満をどう解消するのか、検討する必要がある。
筆者は、現在、さまざまな分野の研究者と一緒に「安心感マネジメント」なるプロジェクトに関わっている。社会のあらゆる局面で安心安全が求められるなか、マネジメントの議論の前提として、まず人々が個々に抱える安心感や不安感を客観的に把握する必要がある。筆者の専門は自然言語処理であり、平たく言えば、普段、人間が使っていることばをコンピュータが取り扱えるようにする研究である。人工知能の一分野であり、近年では「AIを用いたビッグデータ分析」といった形でマスメディアで取り上げられることも増えてきた。このプロジェクトにおける筆者の役割は、この自然言語処理を使って人々が抱えるさまざまな不安をネット上から見つけ出すことである。以下では、まず、自然言語処理を用いた感情分析の手法について説明し、次に、Twitterの投稿を対象に、人々が何に対し、どのような根拠で、安心あるいは不安を感じているかを分析した著者らの取り組みについて紹介する。
自然言語処理を用いた感情分析
自然言語処理では、自由回答記述アンケートやオンラインショッピングサイトのレビューやSNSへの投稿などを対象に、人々の感情を分析する研究がこれまでも数多く行われてきた。その初期の研究では、コンピュータがテキストや文を分類するために、あらかじめ感情語辞書を作成しておき、辞書中の語の有無により、感情を推定する手法が一般的であった。例えば、「心配」や「不安」や「憂い」といった語を感情語辞書の「不安」カテゴリに登録しておき、以下の文(1)を処理するとしよう。
(1) 別に反ワクチンというわけではないんだけど3回目打つの逆に免疫下がりそうで心配だなと予約すらしてない。
この文には「心配」という単語が含まれているので、コンピュータは感情語辞書を参照して、これが「不安」カテゴリの文と判断できる。
このような辞書ベースの手法は単純ではあるが、テキスト集合全体の大まかな傾向を知る上では有効である。ただし、次のような問題点がある。
(問題点1) テキスト中に感情語が含まれていても、必ずしもそのテキストと感情カテゴリが一致するわけではない。
(2) メディアが長いことワクチンへの不安を煽っていたので、その影響もあるのだと思う。
この文(2)には「不安」という単語は含まれているが、この文の著者自身が不安を感じている訳ではない。この逆のパターンもある。
(問題点2) 感情語は含まれていないが、文あるいはテキスト全体を見ると特定の感情カテゴリに分類できる。
(3) 主治医から大丈夫と言われ何の疑いもなくワクチン接種した母。1回目接種後、2回救急搬送。今も急変しないかビクビクしながら眠れない毎日を過ごしています。 弟を医療事故で亡くし、確率が低いからとか滅多にないことだから...という言葉が信じられなくなりました。
この文(3)には感情語辞書の不安カテゴリに分類された感情語(「心配」「不安」「憂い」)は含まれていない。しかし、文全体を読めばこの著者が不安を感じていることは人間には分かる。
上記の問題点に関して、文中の個々の単語にのみ注目するのではなく、機械が文意を汲み取る仕組みが必要となるが、この点については、BERT[1]をはじめとするtransformer[2]を用いた言語モデルを用いることで、かなりの部分が解消されつつある。これは、transformerにおける自己注意機構と呼ばれる仕組みを用いて、文の構造を様々な側面から捉えることがある程度出来るようになったためである。実際、上記文(3)は、著者らが構築したBERTを用いた感情分析モデル[3]を用いるとコンピュータにも「不安」カテゴリの文と判断できる。
コロナ禍におけるワクチンに対する人々の感情変化とその要因の分析
Twitterから新型コロナウィルスワクチンに関するツイートを収集し、ワクチンに対して不安感を持つツイートを分析した事例について紹介する。なお、分析の詳細は文献[3]を参照されたい。
著者らは、2021年6月13日から2021年11月30日の期間にTwitterに投稿されたツイートを収集した。日本、米国、英国、カナダ、オーストラリア、インドの6カ国を対象とし、日本は日本語ツイート、他の国は英語ツイートを分析した。各国のツイート数を表1に示す。分析では、各ツイートを8種類の感情(喜び・悲しみ・期待・驚き・怒り・恐れ・嫌悪・信頼)カテゴリに自動分類した後に時間によって感情の割合がどのように変化するかを調べ(図1〜図6)、急激な変化が起こる時期については、係り受け解析とバースト検知手法[4]を用いて、なぜ変化が行ったのかを調査した(表2)。なお、本分析では「恐れ」と「嫌悪」が不安に対応する。
図1は、日本における感情の推移を示したものであるが、この図を見ると、6月13日から7月31日の期間に「喜び」「悲しみ」「恐れ」の3感情が大きく変動していることがわかる。そこで、これらのツイートを係り受け解析し、この期間に急激に増加した係り受け関係にある単語対を、バースト検知を用いて抽出した。結果を表2に示す。6月13日〜7月31日は、ワクチン接種が本格的に始まった時期であり、「喜び」に関して、接種券が届いた、あるいは接種の予約が出来たことに関するツイートが多いことがわかる。一方、この時期に中日ドラゴンズの木下雄介投手がワクチン接種後に死亡するという出来事があり、ワクチンとの因果関係は不明であるものの、多くの人が悲しみあるいは恐れを感じたことがわかる。
国別に感情の推移を比較すると、日本では恐れに関するツイートの割合が最も高い(図1)のに対し、インド以外の他の四カ国は怒りや嫌悪の割合が高い。なぜ日本だけ異なるのか、その原因はツイートを分析した結果だけからでは明らかにはなっていない。今後は、心理学等の分野で得られている知見も含め、さらなる分析をする必要がある。
表1 各国のツイート数
国名 |
ツイート数 |
日本 |
24,292,412 |
米国 |
325,743 |
英国 |
58,462 |
カナダ |
47,097 |
オーストラリア |
35,274 |
インド |
32,337 |
図1 感情ラベルが付与されたツイート割合(日本)
図2 感情ラベルが付与されたツイート割合(米国)
図3 感情ラベルが付与されたツイート割合(英国)
図4 感情ラベルが付与されたツイート割合(カナダ)
図5 感情ラベルが付与されたツイート割合(オーストラリア)
図6 各感情ラベルが付与されたツイート割合(インド)
表2 日本におけるバーストが検出された係り受け関係
(2021年6月13日-2021年7月31日)
感情 |
係り受け関係 |
ツイート数 |
喜び |
(ワクチン接種,予約) |
7278 |
(ワクチン接種券,届い) |
6448 |
|
(ワクチン,券) |
5277 |
|
(接種券,届い) |
4604 |
|
(ワクチン接種,お疲れ様) |
988 |
|
(2回目,お疲れ様) |
438 |
|
悲しみ |
(ワクチン,打ち) |
15045 |
(Yahoo, ニュース) |
7654 |
|
(接種券,届い) |
6187 |
|
(ワクチン,券) |
5193 |
|
(ワクチン接種券,届い) |
5106 |
|
(ワクチン,足り) |
3350 |
|
(コロナ,感染) |
2734 |
|
(木下,雄介) |
2333 |
|
恐れ |
(Yahoo, ニュース) |
20262 |
(ワクチン接種,進ん) |
11412 |
|
(コロナ,感染) |
9701 |
|
(ワクチン,効果) |
9575 |
|
(コロナワクチン,接種) |
7218 |
|
(感染者,増え) |
6889 |
|
(木下,雄介) |
4192 |
|
(コロナ,怖い) |
3709 |
参考文献
[1] Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K.: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Vol. 1, 4171-4186, 2019.
[2] Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L., and Polosukhin, I.: Attention Is All You Need, Proceedings of the 31st International Conference on Neural Information Processing Systems, 6000-6010, 2017.
[3] 福田悟志,難波英嗣,庄司裕子: コロナ禍におけるワクチンに対する人々の感情変化とその要因の分析,知能と情報,2022.(掲載予定)
[4] Kleinberg, J.: Bursty and Hierarchical Structure in Streams, Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 91-101, 2002.
難波 英嗣(なんば ひでつぐ)/中央大学理工学部教授
専門分野 自然言語処理広島県出身。1972年生まれ。
1996年東京理科大学理工学部電気工学科卒業.
2001年北陸先端科学技術大学院大学情報科学研究科博士後期課程修了。博士(情報科学).日本学術振興会特別研究員(PD)、東京工業大学精密工学研究所助手、広島市立大学情報科学部講師、准教授を経て、2019年より中央大学理工学部教授。現在に至る。
情報処理学会、言語処理学会、人工知能学会などの各会員。現在の研究課題は、特許や論文を対象にした技術動向分析、旅行ブログを用いた旅行者の行動分析などである。