小学館IDをお持ちの方はこちらから
ログイン
初めてご利用の方
小学館IDにご登録いただくと限定イベントへの参加や読者プレゼントにお申し込み頂くことができます。また、定期にメールマガジンでお気に入りジャンルの最新情報をお届け致します。
新規登録
人気のタグ
おすすめのサイト
企業ニュース

本当に使えるAI文字起こし、議事録作成ツールはどれ?精度の高さを比べてみた

2025.05.06

生成AIに注目が集まって以来、会議の議事録作成が自動化され、ずいぶん楽になった方も多いのではないか。文字起こしや要約を数分で行ってくれるのはありがたい。

そんなAIによる音声文字起こし・議事録作成ツールは複数存在する。では結局、「どれが一番向いている?」「精度が高いの?」

そこで今回は、代表的な4つのツールの精度や使い勝手、おすすめシーンやユースケースについて、有識者に比較してもらった。ぜひ使い分けよう。

AIによる音声文字起こし・議事録作成ツール4つを比較!

国内で利用できる代表的なツールとしては、次の4種がある。

1.Microsoft Copilot (Teams連携)
2.Whisper (OpenAI API)
3.Google Workspace AI (Google Meet等でのGemini活用)
4.AmiVoice (AmiVoice ScribeAssist)

AI文字起こし・議事録サービス「Notta(ノッタ)」を提供するNotta株式会社のCOO、田村 清人氏にそれぞれの特徴を解説してもらった。

【取材協力】

田村 清人氏
Notta株式会社 COO
スタンフォード大学卒。米国金融機関、アドテク企業を経て2012年Treasure Data, Inc.に入社。2018年のArm社による買収を経て、最高顧客責任者(Chief Customer Officer)としてグローバルの顧客管理を担当。2024年、Nottaに最高執行責任者(Chief Operating Officer)として入社、マーケティングと営業の責任者として、事業拡大に尽力している。
https://www.notta.ai/

早速、それぞれの比較を見ていこう。

1.Microsoft Copilot (Teams連携)

Microsoft社が提供する生成AIアシスタント。Microsoft 365やTeamsに連携して活用できる。

【おすすめシーン・ユースケース】
Microsoft 365を全社的に導入し、Teamsでの会議が多い企業

【精度】
「Teams標準の文字起こしを基盤とし、日本語と話者分離に対応。精度評価は分かれますが、Copilotによる有料の要約機能は高評価です。ただし、フィラー(※1)除去や専門用語には課題も残り、最終確認は必須です」

※1 フィラー:「あのー」や「えー」など、人が話すときに間にはさむ意味のない言葉。

【手軽さ・使い勝手】
「ライセンス購入が必要ですが、Teams内でシームレスに利用可能で、会議中の操作は容易。リアルタイム処理に対応し、Microsoft 365アプリ連携に強いのが特長です。ただし、要約の直接エクスポート機能は未実装です」

2.Whisper (OpenAI API)

ChatGPTで知られるOpenAI社が公開している文字起こしAIサービス。無料で利用できる。

【おすすめシーン・ユースケース】
開発リソースがあり、話者分離等を別途実装できる技術力のある組織や個人開発者

【精度】
「日本語を含む多言語でトップクラスの文字起こし精度を誇ります。専門用語にも比較的強い一方で、固有名詞の認識や話者分離は不得手。また単体では話者分離(※2)ができないので、別途実装が必要です」

※2 話者分離:複数人が同時に話している音声を識別し、話者ごとに分けて文字起こしする技術

【手軽さ・使い勝手】
「API(※3)利用が前提のため、プログラミング知識が必須。セットアップやUI構築の手間がかかり、手軽さの点では劣ります」

※3 API:Application Programming Interfaceの略。プログラム同士をつなぐインターフェースのこと。

3.Google Workspace AI (Google Meet等でのGemini活用)

Google社のクラウド型グループウェア「Google Workspace」の生成AI機能。Google Meetなどでオンライン会議をした後、GeminiというGoogleの生成AIが議事録を自動生成する。

【おすすめシーン・ユースケース】
Google Workspace環境下のユーザー

【精度】
「Google Meet内で高精度な日本語文字起こしと話者分離を実現します。自動生成される要約や議事録(Googleドキュメント)の質も高いです。専門用語や環境によっては精度が低下する可能性も」

【手軽さ・使い勝手】
「Google Workspaceユーザーなら非常に手軽に導入・利用が可能。カレンダーやドキュメントとの自動連携ができるのも秀逸です。ただし利用には対応プランへの加入が必須です」

4.AmiVoice (AmiVoice ScribeAssist)

「AmiVoice」は、コンタクトセンターなどでよく利用されている音声認識システム。ScribeAssistというAIアプリケーションが議事録作成を自動化する。

【おすすめシーン・ユースケース】
セキュリティを最重要視する企業や官公庁、機密情報を扱う会議

【精度】
「国産の音声認識エンジンとして長年の実績があり、日本語の認識精度は非常に高い評価を得ています。特にビジネスシーンに強く、豊富な業界別辞書や単語登録機能により専門用語にも対応可能。話者分離機能も備えています」

【手軽さ・使い勝手】
「主にスタンドアローン型のソフトウェアとして提供され、オフライン環境でも利用可能で情報漏洩リスクを低減。一度設定すれば直感的に操作できます。ChatGPT連携による要約機能もあります(要ネット接続)」

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2025年6月16日(月) 発売

DIME最新号は、「40代からのメンズ美容入門」!スキンケアの基礎や、白髪、薄毛、加齢臭などこの世代ならではの悩みを徹底解説。さらに、読んですぐにスキンケアを実践できるウーノの豪華2大付録つき!

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。