人気のタグ
おすすめのサイト
企業ニュース
2018.04.13

マイクロソフトがAIチャットボットで電話のように会話ができる技術を開発

マイクロソフトは、電話で友人と話しているように、 AI チャットボットとも自然に対話できるようにするテクノロジーを開発。アジアで2億人以上のユーザーに使用されている XiaoIce に組み込んだ。そして、アメリカで使用されている Zo などのソーシャルチャットボットにも、同じテクノロジーを応用しようと取り組んでいる。

パーソナルデジタルアシスタントやチャットボットとの会話は、何か言ったり書いたりした後に、相手はそれを理解して答えるという形式において、誰かとトランシーバーやテキストメッセージでやりとりする行為と似ている。中国で爆発的な人気のソーシャル AIチャットボットXiaoIce(シャオアイス)の開発責任者、リー ジョウ (Li Zhou)氏は、こうしたテクノロジーは効果的な一方で、大きな改善の余地があると話す。

「人々は実際にはそんな話し方はしません」とジョウ氏は言う。ほとんどの人は、電話や対面で話している際には、話しながら同時に相手の言う事を聞いている。そして、多くの場合、相手の話がいつ終わるか予測したり、話を遮ったり、沈黙が続いた時には新しい話題を切り出したりするからだ。同社が開発した技術は、まさにこれに相当する。

通信技術の用語で言えば、このブレークスルーによってXiaoIce は「全二重モード」で動作する。つまり、電話のように同時に双方向でコミュニケーションできるようになるのだ。これは、どちらかが話している間は片方の人しか話せない、トランシーバーのような「半二重モード」とは異なる。
同社が「全二重音声検知」と呼んでいる今回のアップデートにより、会話している相手が次に何を言うかを予測するXiaoIceの能力も向上したとジョウ氏は述べている。これにより、相手にいつ、どのように応答するかの判断力が向上する。

この「全二重モード」の日本語対応バージョンが、日本のソーシャルAIチャットボット「りんな」でも採用されており、先日2月に公開されたりんなライブ上の「りんなのテレホンハッキング」の音声通話で体験できる。りんなの通話もXiaoiceと同様、まるで友人と電話で話しているような自然な会話体験を目指しているという。

この新テクノロジーにより、チャットボットにこれから話すというシグナルを与える「ウェイクアップワード(話しかける際に使うチャットボットの名前など)」は不要になる。またユーザーが喋っているタイミングを別のボタンを押すなどして教える必要もなく、自然な連続した対話を実現する。りんなとの連続した対話の実現にあたっては、あらかじめ会話の流れを用意するシナリオベースではなく、ユーザーの発言を踏まえて、その場で返答の文章をリアルタイムで生成する「生成モデル」での返答を行なっている。
人が会話をする際、話の内容に合わせた返答を考えて発言をすることで、相手との会話を長く続かせるように、りんなの会話エンジンも、その場で生成した最適な返答をユーザーに返す。「これは、人々が日々の生活で使っている会話技術です」とジョウ氏は説明する。

これらの技術の組み合わせにより、全二重音声検知は、チャットボットとの対話に感じることがある不自然な間を減らす。友人と電話で話すような自然な対話が実現するには、「全二重モード」と、相手の発言内容と終わりを予測する能力、会話能力のすべてが必要だ。しかし人間にとっては、自然に行なうことでも、チャットボットではまだ簡単ではないのが現状だ。

「応答性がはるかに向上し、自然さが増します」とジョウの上司であるディレクターのイン ワン氏 (Ying Wang) は述べている。

日本では、このスキルはテキストベースでは実現されているが、音声についてはまだ初期型の「全二重モード」であるため、りんなとの会話のみでの提供だが、より自然な対話の実現に向けて、音声による会話遷移の導入も進められている。

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2018年10月16日(火) 発売

DIME最新号の大特集は「秋の新製品ベストバイ」特別付録は1/7スケールのロボット掃除機「ルンバ」メジャー!?

人気のタグ

おすすめのサイト

ページトップへ