■連載/阿部純子のトレンド探検隊
リアルタイムで“あの人”の歌声になれるAI歌声変換技術
ヤマハが研究開発を進めている、人の歌声を別人の歌声にリアルタイムで変換する新技術「TransVox(トランスヴォックス)」の実証研究として、「Every Little Thing」とコラボレーションした「なりきりマイク feat.ELT 持田香織 スペシャルルーム」を、東京、静岡、大阪のビッグエコー3店舗にて10月11日までの期間限定で開催している。
ヤマハではAI技術、音声合成技術を使った様々な研究に取り組んでいるが、そのひとつがあらゆる人の歌声をリアルタイムに特定の人の歌声に変換する技術「TransVox」。
ELTの持田香織さんの歌い方の癖をAIに学習させることで、AIが持田さんの声の特徴を把握し、「なりきりマイク」で歌うことで“持田さんの声”が出せるようになる。
なりきりマイクを使って歌うと、歌声の強さ、抑揚、ピッチ、発音のクセなどを瞬時に検出して、AIが学習した持田さんの声だったら、このようになるというデータに変換して歌声を再合成する。マイクを通じて読み取るのは歌い手の声の特徴だけで、装置から出てくるのはゼロから作った持田さんの声になる。これが本人の歌声を加工して、電子的な効果を与えるボイスチェンジャーとは大きく異なる点だ。
歌声の特徴や音の高低に応じた音色の変化など、年代や性別を問わずどんな人の声でも特定の人の歌声に変換することが可能。なりきりマイクの装置は、「1オクターブ上げて歌う」と「原曲キーで歌う」の選択ができ、男性でも1オクターブ上げで歌えば、持田さんの声で歌うことができる。
「技術トレンドとしてAIが各分野で活用されていますが、音楽会社であるヤマハでもAIを様々な分野で研究しています。ピアノの弾き方を再現する、楽曲を解析するなどに取り組んでおり、そのひとつが人の声をAIで完全再現するというものです。今回はこのTransVoxの実証研究の場として、わかりやすいカラオケでイベントを実施しました。
技術の発表の場としては従来よりも早く、できたてほやほやの状態で体験していただいています。ヤマハが開発してきた技術はアーティストや楽器ユーザーが対象の玄人向けでしたが、多くの人に音楽に親しんでもらいたいという思いがあり、音楽でなくても活かせるTransVoxの技術を早めに披露することで、全く違う分野での活用を提案できたらとイベントを実施しました」(ヤマハ マーケティング統括部 倉光大樹さん)
音程を外してしまう、ぼそぼそとして歌うなど、歌うことが得意でない人の音程を調整してうまく歌えるようにするという技術とは異なるが、表現方法として持田さんの声になる=盛ることができるので、例えばビブラートは自分では決まらないという場合でも、なりきりマイクを使えば、持田さんのような美しいビブラートに聞こえるようにできる。
ELTの伊藤一朗さんも自身のYouTubeチャンネル「ELT 伊藤一朗いっくんTV」で、ヤマハの倉光さんと共になりきりマイクについて詳しく検証しており、誰が歌っても持田ボイスに変換される驚きを伝えている。
【AJの読み】誰もが美声で歌えて、イケボで話せる時代が来る!?
今回のなりきりマイクは持田さんの声だが、ELTだけでなくどの楽曲で歌っても持田さんの声で歌うことができる。例えば演歌の「天城越え」を歌っても、持田さんならこう歌うだろうとAIが判断し変換した声で歌うことができる。いわば、歌う人が持田さんの声をコントロールするという感覚だ。
現在のTransVox技術は歌に特化した学習をさせているので、会話での使用は得意ではなく、歌う時に使うのが基本。歌い方のコツとしては、なるべくスピーカーから離れて歌う、マイクをまっすぐに向けできるだけ近づく、はっきりと大きな声で歌う。
装置の上についている大きな赤いボタンが切り替えボタンで、男性なら1オクターブ上げ、女性なら原曲キーで歌うのがおすすめ。
現在はまだ研究段階のため、カラオケになるのか全く別の形で事業化するのかは未定だが、歌声だけでなく、需要があれば話し声も研究の対象にすることができるとのこと。技術的には誰の声でも同じように学習させれば再現できるので、将来的には好きなアーティストになりきれるカラオケや、スパイ映画やアニメでおなじみの瞬時に別人の声に変換したり、イケボ声優の声で会話したりすることも可能になるかもしれない!?
文/阿部純子