【連載】もしもAIがいてくれたら
【バックナンバーのリンクはこちら】
第1回:私、元いじめられっ子の大学副学長です
第58回:AIの力で熱中症は予防できるようになる?
選挙演説をAIで分析してみたら…?
2022年7月10日の参院選に向けて、酷暑の中、立候補者の演説が過熱しています。演説する方も大変だと思いますが、街頭演説を聴く国民も大変です。暑さで意識もうろうとしてしまうので、無駄に長くて意図が伝わらない演説にならないよう、最短でわかりやすい演説をお願いしたいものです。
近年では、選挙の結果を予測するAIもありますが、演説で語られた言葉を分析するAIも最近取り上げられています。
NHKの記事によると、9党の党首が全国各地で行った第一声の演説合計約2時間50分で語られた言葉をすべて書き起こし、合計4万7000字に及ぶ内容をAIで分析し、多く語られた言葉がより大きく表示される「ワードクラウド」という手法で可視化したとのことです。これは、以前から比較的一般的に使われている方法です。2002年のブッシュ大統領による演説と2011年のオバマ大統領による演説を比較した結果も有名です。
ワードクラウドでは、テキストを「形態素解析」という、意味をもつ単語の最小単位に分割し各語の品詞(名詞、形容詞、動詞など)のうち特定のもののみを抽出するということが行われます。そして、各単語の頻度をカウントし、頻度の多い単語ほど大きく表示する、といったことを行います。フォントの種類や大きさや色はなんらかのルールで指定することもできます。大規模な文章の中で、どのような言葉が多く使われていたか一目でわかるため、便利です。
ワードクラウドに「tf-idf」という指標も用いれば、例えば、各党の演説で用いられた語が、どのくらいその党の演説に特徴的であったかを分析することも可能になります(NHKでそこまでやっているかはわかりませんが)。tf-idfとは、情報探索やテキストマイニングなどの分野で利用される、文書中に出現した特定の単語がどのくらい特徴的であるかを識別するための指標です。
演説での最頻出単語「国民」で連想される言葉は「○○の自由」
どのような単語を各党が演説で使っているかを見れば各党の考え方を有権者が比較しやすい、というメリットがあります。酷暑の中での演説なので、最短でわかりやすい演説をしていただくために、AIを活用した演説をしていただく可能性をより踏み込んで考えてみました。
すでに行われているかもしれませんが、どういう単語を使うと、何が連想されるか、どういった印象になるかをよく分析して、有権者に伝えたいことを効果的に伝えられる単語を使った演説を組み立てていただきたいですね。
NHKによると、今回の選挙の注目ワードと、各党が重視したテーマが浮かび上がってきたとのことですが、特定の党の例だけ挙げるのは不公平なので、9党の演説で使われた言葉の割合を分析した結果を見てみました。
最も大きな割合を占めたのが「選挙」という言葉で、「日本」「人」「政治」「国」「国民」という言葉が続いているということです。
そこで、「国民」という単語を、私の会社のAIで分析し、連想されるであろう単語を予測して可視化してみました(実際には、属性別など詳細に設定して丁寧に分析できます)。
「国民」というと、「言論の自由」「報道の自由」「表現の自由」が多く連想されるということでしょうか。一国民として、いつも自由に記事を書かせていただいています。
坂本真樹(さかもと・まき)/国立大学法人電気通信大学副学長、同大学情報理工学研究科/人工知能先端研究センター教授。人工知能学会元理事。感性AI株式会社COO。NHKラジオ第一放送『子ども科学電話相談』のAI・ロボット担当として、人工知能などの最新研究とビジネス動向について解説している。オノマトペや五感や感性・感情といった人の言語・心理などについての文系的な現象を、理工系的観点から分析し、人工知能に搭載することが得意。著書に「坂本真樹先生が教える人工知能がほぼほぼわかる本」(オーム社)など。