洋服やメイクで外見を整えるのと同じ様に、声も好きなように変えられたら…。きっと、話したり歌ったりする感覚は、今とはまったく違うものになるはずだ。CoeFont社が運営する「CoeFont」の技術とビジネスモデルは、未来のコミュニケーションのあり方を予見させてくれる。
あの著名人も!? あらゆる声が集まる仕組み
「CoeFont」はディープラーニングによる音声合成技術を活用したAI音声プラットフォームだ。従来は音声合成に、50万円以上のコスト、10時間以上の収録を必要としていたが、CoeFontでは500円、15分の収録でAI音声を作成できる。
テキストの読み上げに対応し、文脈からアクセントを学習できる技術は特許取得済み。例えば、「はし」という文字が「橋」なのか「箸」なのか、AIが前後の意味から判断してアクセントを使い分ける。試しに使ってみると、かなりの精度で自然に発声されることがわかるはずだ。
とはいえ、AI音声の技術は今まさに過渡期にあり、数年以内にはかなり自然な発声が可能になると言われている。つまり、近いうちに技術的なアドバンテージは失われる可能性が高い。
そこで注目したいのが、誰もが簡単に自分の声をAI音声化し、文字の「フォント」のように誰でも使用できるという「CoeFont」のコンセプトだ。同社が独占的にAI音声を作って販売するのではなく、誰でもクリエイター/ユーザーとして参加できるマーケットプレイスを構築した点がおもしろい。作成したAI音声は、クラウド上で公開でき、他のユーザーが利用するたびにクリエイターに収益として還元される。
今のうちにクリエイター、ユーザー、コンテンツが集まる仕組みを構築しておけば、技術的な差異が小さくなっても、プラットフォームとしての優位性を維持できる。現在、著名人、プロの声優、ナレーター、アマチュアの声自慢、自分の子供の声など4000種類以上の声のフォントが集まる。トム・クルーズの日本語吹き替えを担当する森川智之氏、お天気キャスターの森田正光氏、ジャーナリストの田原総一朗氏らのAI音声も利用可能だ。
メタバースでのAI音声の活用も!?
では、CoeFontは社会やビジネスのどんなシーンで利用されるのだろうか? 現在のところ、用途はゲーム、YouTuber/Vtuberなどの動画制作、音声広告、研修動画、オーディオブックなど、クリエイティブ領域での利用が主流。
さらに、同社は声帯摘出手術やALS(筋萎縮性側索硬化症)の病気などで、声を失う可能性のある人に対して、無料でサービスを提供している。このたび、デジタルハリウッド大学との共同プロジェクトで、昨年ALSであることを公表した杉山知之氏のAI音声の作成に取り組んだ。
通常は本人の声を収録しなければならないが、今回は社会実装に向けた試みとして、杉山氏の過去の講演の音源などから音声を選別し、AI音声を生成した。
この分野では、将来的にはAI音声はリアルタイムの音声合成が可能になると予測されている。入力したテキストを読み上げるのではなく、ボイスチェンジャーのように会話をAI音声化できるようになるという見立てだ。
そうなれば本格的に実現されるのが「声のアバター」。ゲームやSNS、VR空間のアバターで、自分の好きな見た目になれるのと同じように、自分の好きな声を、しかも毎日違う声を使いこなせたら、コミュニケーションはぐっと楽しくなる。
声を集めるプラットフォームとしてのCoeFontは、未来を見据えて、さらに強みを活かすことができる仕組みなのだ。
AI音声プラットフォーム「CoeFont」、デジタルハリウッド大学と共同で、杉山学長の”過去の音声”から、AI音声の生成に成功
取材・文/ソルバ!
人や企業の課題解決ストーリーを図解、インフォグラフィックで、わかりやすく伝えるプロジェクト。ビジネスの大小にかかわらず、仕事脳を刺激するビジネスアイデアをお届けします。
https://solver-story.com/
@DIME公式通販人気ランキング