
生成AIに注目が集まって以来、会議の議事録作成が自動化され、ずいぶん楽になった方も多いのではないか。文字起こしや要約を数分で行ってくれるのはありがたい。
そんなAIによる音声文字起こし・議事録作成ツールは複数存在する。では結局、「どれが一番向いている?」「精度が高いの?」
そこで今回は、代表的な4つのツールの精度や使い勝手、おすすめシーンやユースケースについて、有識者に比較してもらった。ぜひ使い分けよう。
AIによる音声文字起こし・議事録作成ツール4つを比較!
国内で利用できる代表的なツールとしては、次の4種がある。
1.Microsoft Copilot (Teams連携)
2.Whisper (OpenAI API)
3.Google Workspace AI (Google Meet等でのGemini活用)
4.AmiVoice (AmiVoice ScribeAssist)
AI文字起こし・議事録サービス「Notta(ノッタ)」を提供するNotta株式会社のCOO、田村 清人氏にそれぞれの特徴を解説してもらった。
【取材協力】
田村 清人氏
Notta株式会社 COO
スタンフォード大学卒。米国金融機関、アドテク企業を経て2012年Treasure Data, Inc.に入社。2018年のArm社による買収を経て、最高顧客責任者(Chief Customer Officer)としてグローバルの顧客管理を担当。2024年、Nottaに最高執行責任者(Chief Operating Officer)として入社、マーケティングと営業の責任者として、事業拡大に尽力している。
https://www.notta.ai/
早速、それぞれの比較を見ていこう。
1.Microsoft Copilot (Teams連携)
Microsoft社が提供する生成AIアシスタント。Microsoft 365やTeamsに連携して活用できる。
【おすすめシーン・ユースケース】
Microsoft 365を全社的に導入し、Teamsでの会議が多い企業
【精度】
「Teams標準の文字起こしを基盤とし、日本語と話者分離に対応。精度評価は分かれますが、Copilotによる有料の要約機能は高評価です。ただし、フィラー(※1)除去や専門用語には課題も残り、最終確認は必須です」
※1 フィラー:「あのー」や「えー」など、人が話すときに間にはさむ意味のない言葉。
【手軽さ・使い勝手】
「ライセンス購入が必要ですが、Teams内でシームレスに利用可能で、会議中の操作は容易。リアルタイム処理に対応し、Microsoft 365アプリ連携に強いのが特長です。ただし、要約の直接エクスポート機能は未実装です」
2.Whisper (OpenAI API)
ChatGPTで知られるOpenAI社が公開している文字起こしAIサービス。無料で利用できる。
【おすすめシーン・ユースケース】
開発リソースがあり、話者分離等を別途実装できる技術力のある組織や個人開発者
【精度】
「日本語を含む多言語でトップクラスの文字起こし精度を誇ります。専門用語にも比較的強い一方で、固有名詞の認識や話者分離は不得手。また単体では話者分離(※2)ができないので、別途実装が必要です」
※2 話者分離:複数人が同時に話している音声を識別し、話者ごとに分けて文字起こしする技術
【手軽さ・使い勝手】
「API(※3)利用が前提のため、プログラミング知識が必須。セットアップやUI構築の手間がかかり、手軽さの点では劣ります」
※3 API:Application Programming Interfaceの略。プログラム同士をつなぐインターフェースのこと。
3.Google Workspace AI (Google Meet等でのGemini活用)
Google社のクラウド型グループウェア「Google Workspace」の生成AI機能。Google Meetなどでオンライン会議をした後、GeminiというGoogleの生成AIが議事録を自動生成する。
【おすすめシーン・ユースケース】
Google Workspace環境下のユーザー
【精度】
「Google Meet内で高精度な日本語文字起こしと話者分離を実現します。自動生成される要約や議事録(Googleドキュメント)の質も高いです。専門用語や環境によっては精度が低下する可能性も」
【手軽さ・使い勝手】
「Google Workspaceユーザーなら非常に手軽に導入・利用が可能。カレンダーやドキュメントとの自動連携ができるのも秀逸です。ただし利用には対応プランへの加入が必須です」
4.AmiVoice (AmiVoice ScribeAssist)
「AmiVoice」は、コンタクトセンターなどでよく利用されている音声認識システム。ScribeAssistというAIアプリケーションが議事録作成を自動化する。
【おすすめシーン・ユースケース】
セキュリティを最重要視する企業や官公庁、機密情報を扱う会議
【精度】
「国産の音声認識エンジンとして長年の実績があり、日本語の認識精度は非常に高い評価を得ています。特にビジネスシーンに強く、豊富な業界別辞書や単語登録機能により専門用語にも対応可能。話者分離機能も備えています」
【手軽さ・使い勝手】
「主にスタンドアローン型のソフトウェアとして提供され、オフライン環境でも利用可能で情報漏洩リスクを低減。一度設定すれば直感的に操作できます。ChatGPT連携による要約機能もあります(要ネット接続)」