日本マイクロソフトはこのほど、「新しいBingの構築にあたって」と題したブログ記事を公開した。本ブログは、米国で公開された「Building the New Bing」の抄訳をもとに掲載されたものだ。
技術革新の舞台裏:Prometheus
新しいGPTモデルは、大規模言語モデル(LLM:Large Language Model)が飛躍的に進歩したことを示すものだったが、他のLLMと同様、特定の時点におけるデータでトレーニングされたものだった。そこで、Bingのバックエンドパワーと組み合わせることで、ユーザーエクスペリエンスをより豊かに、より適切に、そしてより正確にできるのではないかと考えた。
具体的に言うと、Prometheusという独自のテクノロジを開発したのだ。これは、最新かつ包括的なBingのインデックスやランキング、そして回答結果と、Open AIの最も先進的なGPTモデルの創造的推論機能を組み合わせた初のAIモデルだ。Prometheusは、BingとGPTの能力を活用し、Bing Orchestratorというコンポーネントを通じて内部クエリを繰り返し生成する。
これにより、与えられた会話のコンテキスト内で、ユーザーのクエリに対して正確で豊富な回答を数ミリ秒以内に提供することを目指している。このPrometheusが生成した回答を、マイクロソフトではChatアンサーと呼んでいる。
Prometheusのコアとなる仕組み、それは、関連する内部クエリを選択し、それに対応するBingの検索結果を活用することだ。この仕組みにより、関連度と鮮度が高い情報をモデルに提供できるようになる。これによってモデルは最近の質問に対し、より正確な回答を導き出せるようになるのだ。
この方法はグラウンディングと呼ばれている。別の言い方をすると、モデルはBingから提供されたデータに基づいて判断するため、Bing Orchestratorを介してBingのデータによってグラウンディングされるのだ。以下の図は、Prometheusの仕組みをハイレベルで示したものだ。
最終的には、天気や株価、スポーツ、ニュースなど、関連するBing検索の回答を、PrometheusがChatアンサーに添付し、よりリッチで魅力的なユーザーエクスペリエンスを提供するようになるだろう。
Bingのグラウンディング技術により、PrometheusはChatアンサーの文章に引用を埋め込むこともできるため、ユーザーはクリックするだけで簡単にそのソースにアクセスし、情報の確認が可能だ。ウェブのエコシステムを健全に保つには、情報源にトラフィックを送ることが重要なので、Bingでは引き続きこの仕組みを最大の目標のひとつと位置づけている。
すべての人に役立つ包括的な体験の実現を目指して
グラウンディングは優れたイノベーションだが、新しい技術なので責任を持って適用する方法を考えなくてはならない。不正確な情報を減らすことや、攻撃的で有害なコンテンツを防ぐことなどもその一例だ。そこで新しいBingプレビューでは、ユーザーからのフィードバックを収集し、Prometheusをさらに改善することを主な目標としている。
ユーザーからはすでに貴重なフィードバックを受け取っており、最初の2週間で実際のユーザーから学んだことのほうが、数ヶ月間研究室で学んだことよりはるかに多いと感じている。最近のブログで説明したように、マイクロソフトではその学びを実行に移そうとしている。
例えば、モデルに送信するグラウンディングデータを4倍に増やし、Chatアンサーの精度を向上させる予定であるし、ユーザーがタスクや目標に応じて自身の体験を最適化できるよう、制御機能を高めるトグルを追加することも検討している。
もうひとつ重要な学びがあった。それは、チャットのセッションがとても長くなると、ベースとなるチャットモデルが混乱し、Chatアンサーの精度が低下したり意図しない口調になったりすることがあるという点だ。
そこで最近、チャット体験に対話回数の制限を設けた。マイクロソフトでは、顧客のフィードバックを基にチャット体験を拡張し、モデルのグラウンディングと口調の改善に努めており、対話回数制限の導入もその一環だ。