
2024年よりDIMEにて連載中の「マンガでわかる生成AI」の原作を担当している、アステリア株式会社、および生成AI協会(GAIS)のエバンジェリスト 森一弥です。
本コラムは読者の皆さんにとって身近な生成AIツールや新機能を、実際に森が触ってみてご紹介するコーナー。今回は仕事やプライベートでもちょっとした動画作成に使えそうな「AKOOL」を触ってみました。
皆さんは、所属している会社や組織で、ちょっとしたプレゼン動画を作成したことはありますか? 製品やサービス、会社の紹介や、プライベートだと冠婚葬祭でのメッセージビデオなど、なにかと使いたい場面があるのではないでしょうか。昨今のAIブームを知っていれば「AIでいい感じに作れたりしないの?」とついつい思ってしまいますよね。
もちろん、AIを使った動画作成のサービスはたくさんあります。今後もさらに増えていくことが予想されますが、いま僕が注目しているのが、人物の写真や音声などを素材に、オリジナルの動画を作成してくれる「AKOOL」です。
これを使うと、写真の人間を喋らせるようなアバター動画が作成できたり、台本となる文章をアップロードすれば自分の声(風)の音声で読ませたりということができるようになるんです。早速ご紹介していきましょう!

「AKOOL」はアバターで動画を作れるサービス
私はエバンジェリストという立場なので、常日頃からAI関連の情報収集やセミナーでの講演、記事作成や取材対応などを行っています。最近は社内のチームから「より広くAIのことを知ってもらうために、解説動画をYouTubeでアップできないか?」という話がありました。
動画で情報発信することは賛成ですし、より広いターゲットにアプローチできるのもそのとおりでしょう。しかし、AI関連は情報のアップデートが早く、新しいものを頻繁に作る必要があり、またすでに出した動画の内容を修正・更新する必要が出てきたりもします。
毎回その度に撮影するとなると、かなり大変……。そこで、撮影の手間をあまりかけずに自分が話している動画を作成できるAIのサービスを探してみたところ、「AKOOL」に行き着きました。
サービスに求めたのは、以下の条件です。
● 既存の写真や動画を素材にしたアバターをつくれる
● アバターに台本テキスト(日本語)を喋らせることができる(リップシンクも対応)
● 録音した自分の声から、音声を生成できる
「AKOOL」は初回サインアップの際に、サービス利用に応じて消費される「クレジット」が100もらえるので、ある程度の範囲までは無料で使うことができます。手順を紹介するので、興味のある方はぜひ一度試してみてください!
step1. 無料でサインアップ
「AKOOL」のWebページにアクセスして、「サインアップ」ボタンを押します。

Googleや、Discordを通じたログインができるようになっています。メールアドレスとパスワードでアカウントを作成することも可能です。お好きな方法でアカウントを作成し、ログインしてみてください。
ログインすると、いきなり価格表がずらり。とりあえず無料で試してみたいという方は、右上の☒ボタンで価格表を閉じてOKです。

すると、サービスの「ホーム」画面が表示されます。「AKOOL」は様々なツールが含まれている統合的なツールになっていて、作ったアバターと会話できるチャットを作ったり、ビデオを翻訳して口の動きを合わせてくれたりする機能もあるようです。幅広いニーズに応えてくれそうな予感がします。

Step2.自分の音声を収録
今回の目的を叶えるべく、自分の写真と音声から動画を作ることを試してみます。まずは自分の音声を録音。左のメニューの「ツール」から「すべてのツール」を選び、上部のタグから「音声用」を選ぶと音声に関するツールに絞られます。

音声ツールの中から「オーディオクローン」を選びましょう。

ブラウザを使って、その場で録音することもできますし、音声ファイルを選ぶこともできます。右側には「音声名」と「オーディション台本」「タグ設定」と項目が並んでいます。
今回は、自分の音声の一部からAIで音声を作成し、入力した台本を読ませる方法を紹介していきます。
早速、簡単な台本を作って音声を録音してみましょう。画面上には英語の原稿が表示されていますが、これを消して日本語で書き直せばOKです。録音の時間は5~60秒と注意書きがあるので、名前とちょっとした自己紹介などで良いのではないでしょうか。
「音声を録音する」を押して、ブラウザでマイク使用許可を承認。「Record audio」を押して、自分で原稿を読んで録音しましょう。

録音が済んだら「音声名」にわかりやすい名前をつけ、いくつかタグを設定。「結果を生成する」を押せば音声クローンが生成されます。
Step3.リップシンク動画の作成
続いては、メインとなる「喋っている様子の動画」です。
これは手持ちの写真をアップして作成します。先程の「ホーム」画面から「すべてのツール」を選択し、「For image」で絞り込んでいきましょう。

この中に「トーキングフォト」というツールがあります。
まずは利用する写真を選びます。ファイルのサイズや解像度が大きすぎるとエラーが出るので、適切なサイズの写真を選択。

写真がアップできたら「スクリプト」に読ませる原稿を書きます。こちらも日本語でOKです!

ではいよいよ、画像に動作をつけます。スクリプトの下にある音声の選択を押して、先ほど作った「自分の音声」を選びます。

「Generate Audio」ボタンを押すと、設定した自分の音声でスクリプトを読んでくれました! これはなかなか感動しますね!
もちろん原稿によっては、漢字の読み方が違っていたり、日本語のイントネーションが怪しかったりすることもあるかもしれません。そんな場合も諦めず、セリフをカタカナにしてみたり、言い回しを変えてみるのが良いでしょう。ここは試行錯誤が必要です!
音声が完成したら、写真とリップシンクした動画を作成します。リップシンクしている動画を作成するにはクレジットが消費されます。作成された動画の秒数で消費量が変わるようなので、あまり長いスクリプトを書くと多く消費されてしまうかもしれません。
スクリプトの下にある「ビデオから感情へ」のサンプルを選ぶと、似た感じで表情をコロコロ変えてくれたりもしますので試してみるのも良いでしょう。設定が完了したら「プレミアムな結果を生み出す」ボタンを押します。
できました! AI 森一弥による動画です!
まとめ
今回は、プレゼンに使うスライド資料と合成して動画を作成して、さっそくYouTubeで公開してみました。どうでしょうか!? 生成AIの最新動向として、「AIエージェント」について「Deep Research」と比較しながら解説をしています。
AKOOLは他の音声編集機能もたくさんありますので、気になる方はぜひ色々試してみてください。面白がっているとクレジットがすぐなくなってしまうのですが玉に瑕……(笑)。
まだまだ違和感がある箇所もありますが、2025年7月時点でのAIのクオリティとして、今後の進化と比較してみるのも面白いのではないでしょうか。最後までご覧いただき、ありがとうございました!
森 一弥(もり かずや) https://twitter.com/dekiruco
アステリア株式会社 ノーコード変革推進室 エバンジェリスト。 テレワーク推進の波に乗り、某有名SFアニメの聖地である箱根に移住。アニメや漫画、甘いものとかっこいいクルマをこよなく愛す、気ままな技術系エバンジェリスト。 AIやブロックチェーンなど先端技術とのデータ連携を得意とし、実証実験やコンサルティングの実績も多数。見聞きしたことは自分でプログラミングして確かめた上でわかりやすく解説することが信条。 現在は AI や IoTなどの普及啓発に努め、生成AI協会(GAIS)のエバンジェリストとしても活動中。