ChatGPTは世界1億人以上のユーザーに使われながら大きな炎上を招くような表現はほぼ見られない。その精度はどう確保されているのだろうか。今後考えられる経済的なインパクトなどについて3人の識者に聞いた。
AIスペシャリスト
清水 亮さん
著書『よくわかる人工知能』(KADOKAWA)などで知られるAIのプログラマー/クリエイター。国内外の企業における開発実績も多い。
IT批評家
尾原和啓さん
京都大学院でAIを研究。マッキンゼー、ドコモ、Google、リクルート、楽天などで事業の立ち上げや役員を担当。 國光宏尚氏の著書『メタバースとWeb3』(MdN)の制作にも協力。
KDDI総合研究所 リサーチフェロー
小林雅一さん
情報セキュリティ大学院大学客員教授。物理学とマスコミ論に長け、著書は『ゼロからわかる量子コンピュータ』(講談社)など。
ChatGPTをはじめ、生成系AIが実用的なレベルにまで到達してきた理由について、どのように考えていますか?
小林 ブレークスルーをもたらしたのが、2017年にグーグルの研究チームが提唱した「Transformer」と呼ばれる新しいモデル(予測方式)です。これは学界発表されたので誰もが使えるようになり、この方式を使ってシリコンバレーを中心に「大規模言語モデル(Large Language Model:LLM)」と呼ばれる新しい種類のAI開発が盛んになりました。
尾原 「Transformer」には大きくふたつの特徴があり、ひとつは「何に重きを置いて次にくる単語を考えればいいのか」「次にどんな単語がくるともっともらしい確率が高くなるのか」ということを数式的に実現していること。もうひとつは発達の目覚ましいGPUによってトレーニングが可能になったものすごい量の並列計算処理に向いていることです。これらの特徴により、例えば10の22乗くらいという、ものすごい量の学習トレーニングをすると、一定のレベルを超えた時、突然、翻訳や文章予測の精度が高まり、かなり正答に近い回答を出せるという不思議な現状が起こることがわかりました。大規模な競争が始まったのは、このことが着目されたことも理由です。
小林 開発者たちが「Transformer」の方式に基づいて大規模言語モデルに大量のデータを読み込ませて機械学習を行なわせると、言葉を理解して話せる(=チャットする)ようになるばかりか、人間の要求に応じてコンピューター・プログラムを生成したり、絵画、イラスト、写真のような画像も描いたりすることもできるようになりました。これは「創発(emergence)」と呼ばれる現象で、AI研究者にも理由は謎なのですが、まさに今のAIブームの背景にあるものです。
OpenAIの大規模言語モデル「GPT-4」は回答の精度が高いと評価されています。どのように実現しているのでしょうか?
小林 考えられるのは、パラメーターの数がGPT-3.5よりも桁違いに増加したこと。数字は明らかにされていませんが、噂では100兆個に達したとの説もあります。それ以前のGPT-3.5は、おそらく1750億個くらいなので、100兆個が本当なら「桁違い」という表現ではすまないアップグレードです。
尾原 最近ではOpenAIのサム・アルトマンCEOが「いたずらにパラメーター数を上げていくことが性能の良さではない」と言っていて、GPTが毎回どういうステップで回答を生成しているのか、GPT自身にアウトプットさせる〝リーズニング〟を、GPT-4では〝アライメント〟といわれる調整によって強くしています。その結果、例えば「ある問題を解いていることに夢中になるあまり、全体の文脈を忘れて間違える」といったことが減り、複雑な処理ができるようになったのです。
清水 学習データのソースは非公開ですが、マルチモーダル(複数種類のデータ)で学習したことが特徴だといわれており、画像や動画をテキストと同時に学習していると考えられます。「Tra
nsformer」ベースでこれを行なうには、上半分の画像から下半分の画像を予測して生成できるAIツール「ImageGPT」のように、画像や動画をトークン化して学習するといった高度なことが行なわれているはず。ある意味で「ものごとの理」や因果関係を学習しているともいえますね。
小林 背後にマイクロソフトがいることもOpenAIの強みでしょう。30億ドル(当時の為替レートで3000億円以上)に及ぶ投資金は、通常、GPT-3のような大規模言語モデルの開発には5億ドルくらいで十分といわれる中、桁外れの金額です。
4月にOpenAIのサム・アルトマンCEOが来日しました。狙いは何でしょうか?
小林 OpenAIが日本市場を重視するのは〝日本人がいいお客様〟だから。まず市場が大きい。国がいくら借金を抱えていようが、人口が減少して経済が右肩下がりになろうが、当面、日本国民は他国の人たちに比べれば相対的に豊かです。また、武器の製造に活用しようといったむちゃなAIの使い方をする人も、相対的に少ないでしょう。ゆえにトップレベルのAI開発企業にとって日本は理想的な市場なんです。一方、OpenAIは日本のAI開発者を、大学の研究者にせよ、企業の技術者にせよ、本音では歯牙にもかけていません。日本は自分たちの作り上げた大規模言語モデルをありがたく導入してくれて、自分たちの会社用や組織用に、少し手直しして使ってればいいと、考えているように思われますね。
尾原 世界に目を向けると、ヨーロッパはどうしてもプライバシーに関してすごくセンシティブ。「自分がコントロールできなきゃいけないもの」ということで法律体系ができているので、AIに厳しいです。キリスト教圏ということもあって「人間を超えるAI」といった話をタブー視するところもあります。
清水 日本は著作権法で明確に、AIが著作物を学習することを許可している先進国でも珍しい国。しかも学習用のコンテンツを膨大に有し、さらにコンテンツを作り続けるロジスティクスが揃っている国でもある。データが勝負を決める局面でOpenAIが興味を持つのは当然でしょう。OpenAIは、EUをはじめとする各国から警戒されつつあり、これから集団訴訟と戦わなければならないという事情も。欧州での展開はリスクが高いのです。
尾原 日本はいわば〝鉄腕アトム〟と〝ドラえもん〟の国。むしろ「AIはお友達としていろんなことができるじゃん」ということで、AIにポジティブといえますよね。そんな日本を、OpenAIは味方につけておきたいという地政学的なバランスがあるのではないかと。
OpenAIが提供しているようなAPIの活用で、今後考えられそうな変化はありますか?
小林 米国の大学やシンクタンクの調査・研究などによれば、ChatGPTなどのAIの影響を最も受けるのは「人文科学系の大学教授」だそうです。そのほかにも影響を受けそうなのは「法律系の専門職」。弁護士ではなく、米国で「パラリーガル」と呼ばれている法律系の事務職であり、広範囲の法律の知識は備えているものの、基本的には定型的な日常業務が主な仕事です。こういう職種も莫大な知識を蓄えられて、疲れを知らない業務遂行能力を誇る生成AIにとって代わられる危険性が高いでしょう。
尾原 ChatGPTが最初に効果を発揮するのは教育系でしょう。学校の教育というのは理解しているところに合わせないといけないので、一度落ちこぼれると、取り戻す手段が極端に少ないんです。自分のことを「ダメな人間」だと思われたくないことも関係して、わからないことを先生に聞きづらく、質問するというハードルが非常に高い。一方で、ChatGPTは個々の理解度に応じて、全く嫌がらずに、いくらでもつきあってくれます。わからないことをわかるところまで分解してくれる。そうした「冒険の伴走者」としての価値のほうが大きいと考えています。だから教育面では、ものすごいインパクトがあると思います。それと、人間って自分がわかるところまで〝分解〟できていないから行動しないことって、結構多いじゃないですか。例えばバリ島でヨガを学ぼうとした時に、誰かに聞こうと思ったとしても誰に聞いたらわからないというような、ビザや国内情勢のことを気軽に質問できるのは大きい。不安点を解消してくれるから、人は行動を起こすようになると思うんですよね。そうしたことから、旅行、趣味、転職や引っ越し、それに結婚といった、リクルートグループが手がけているようなサービスコマース領域で、今後については一般向けの利用が進んでいくのではないでしょうか。
今後どんな経済的なインパクトがあると考えますか?
尾原 人間の仕事は、まずコンセプトを考え、コンセプトを計画に落とし込み、計画を実行するもの。仕事でChatGPTのような生成系AIを生かせるのは、フィジカルなタスクを伴わないホワイトカラーの仕事です。特に入社3年目くらいまでの仕事が想定できます。コンセプトを計画に落とし込む部分で、ChatGPTならものすごく速く、なおかつレスポンスよくやってくれます。そのため、もっとコンセプトを考える部分に注力できるようになるのです。また、新しい技術やイノベーションは、コスト削減の側面で語られることが多いですが、イノベーションによる恩恵は、コンセプト作りから計画実行までのサイクル=回転数を上げることによる質的な変化のほうが、重要だと考えています。
例えばソフト開発でいえば、コンセプトを考えても実際にプログラムを構築するコストが莫大だったから、表に出さずに終わっているものが多いわけです。それがChatGPTのような生成系AIによって、思いついたコンセプトに基づく実行計画が素早く作れるようになり、しかもプログラミングまで容易にできるわけです。多くの商品をユーザーに届けられ、その分、多くのフィードバックも得られるでしょう。そうした試行錯誤の回数がChatGPTによって増えていくことから、結果としてイノベーションが生まれやすくなるんです。
これまで「単純な反復作業はAIに置き換わる」といわれてきました。でもChatGPT以降の動きとしては、むしろ「時給単価が高いホワイトカラーの3年目ぐらいまでにやる仕事がAIに置き換わる」ことになります。短期的には、そこのコストが劇的に下がるビジネスインパクトがやってきます。中・長期的には新人社員よりも高効率なAIへの置き換わりが進み、イノベーションが起きやすくなるはず。それが生成系AIによる経済的インパクトの本質だと考えています。
AIブームの盛衰と大規模言語モデルの系譜
第1次はコンピューターによる「推論」「探索」が可能に。第2次は専門知識を取り込んで推論させることで、コンピューターを専門家のように振る舞わせる技術が注目された。
大規模言語モデルに読み込ませるパラメーター数は2018年以降から急増が続いてる。最新のGTP-4については、2019年当時に比べてパラメーター数は約1万倍だ。
取材・文/小林雅一、清水 亮、河原塚英信
DIME最新号の大特集は「ChatGPT/Bing/Google Bard AI検索超活用術」
企画書の作成から調査分析、営業ツール、Exel関数、資産運用、ビジネス英会話、リスキリング、アプリ開発まで、これを読めば、ChatGPTの超便利な活用法がまるわかり!あなたの欲しい回答を導き出すベストプロンプトを詳しく解説。まさに超保存版です!!
■DIME SPECIAL 2
最安の電力会社はどこ? 通信+電気代のセットプランは損!? ほとんどの保険はムダ!? 賢い家計マネジメントで年間50万円カット!!
固定費削減の最適解
■DIME SPECIAL 3
住宅メーカー系 vs 家電量販店 vs ホームセンター系 vs 人気雑貨&家具店系、ベストな選択肢は? 最大275万円のお得な「補助金」リスト付き!
低予算でここまでできる!最新リフォーム案内
■MONEY HACKS
「インバウンド復活」「米国利上げ終了」「新日銀総裁」「半導体需要増」「新NISA」注目キーワードから読み解く!
2023年後半に復活!?日本株逆襲のシナリオ
■ENTERTAINMENT HACKS
ファミコン、PCエンジン、セガサターンetc.平成ゲームソフトで一攫千金!
プレ値続出のレトロゲーム市場 最新レポート
◆TREND WATCHING
・Z世代がハマるカセットテープの深イイ魅力
・食料問題も環境問題も解決するおいしい食材・海藻
※電子版には付録は同梱されません。
取材・文/DIME編集部