小学館IDをお持ちの方はこちらから
ログイン
初めてご利用の方
小学館IDにご登録いただくと限定イベントへの参加や読者プレゼントにお申し込み頂くことができます。また、定期にメールマガジンでお気に入りジャンルの最新情報をお届け致します。
新規登録
人気のタグ
おすすめのサイト
企業ニュース

超薄型AIレコーダー「Plaud Note Pro」の文字起こしの精度から話者分離まで使い勝手を徹底検証

2025.11.23

 AIボイスレコーダーとしてその知名度を高めているPLAUDが、10月に新モデルを発売した。それが、「Plaud Note Pro」だ。ハードウェアとしては、新たにディスプレイを搭載。録音状態やバッテリー残量などが、本体を一目見るだけで分かるようになった。見た目で気づきづらい部分としては、マイク性能も大きく向上している。

 本体の厚みや重量は“Pro”がつかない「Plaud Note」を受け継いでおり、その使い勝手も似ている。一方で、この製品はハードウェアだけでその真価を判断することができない。アプリをはじめとしたソフトウェアや、クラウド側のAIも一体となった製品だからだ。Plaud Note Proの登場に合わせ、専用アプリもマルチモーダル化。画像やテキストを録音中に加えられるようになった。

 また、多次元要約に対応して、次のアクションを提案してくれたり、録音したデータに基づいて質問ができたりと、単なる文字起こし以上の機能を実装している。では、文字起こし対応のボイスレコーダーとして、Plaud Note Proの精度はどの程度のものなのか。日々記者会見や発表会を取材する筆者が、現場に同機を持ち込んで実力をチェックしてみた。

文字起こしや要約が可能なAIボイスレコーダーのPlaud Note Proの実力を、実戦でチェックした

ディスプレイ搭載でより使いやすく進化、充電はやや面倒

 まずは、ハードウェアからチェックしていこう。改めてその特徴を解説すると、同機は非常に軽くて薄いレコーダーだ。厚みはわずか2.99mmで、重さは30g。500mAhのバッテリーを搭載している。本体には4つのMEMSマイクとVPUセンサーを備えているが、後者は通話の録音に使うためのものになる。

本体は手のひらに収まるコンパクトさで、厚みも3mmを下回る

 Plaud Note Proならではの新機能が、有機ELのディスプレイ。ここに、録音しているかどうかやバッテリーの残量を表示できる。機能面では、ここが大きな違いと言っていい。ディスプレイを搭載したことで、今の状態が分かりやすくなり、より直感的な操作が可能になった。Plaud Note Pro発売後も、前モデルは並売しているが、差額は約3000円。操作の分かりやすさを取るなら、選ぶべきはProと言える。

ディスプレイを搭載し、現在の状態が分かりやすくなった

 基本的にはスマホとペアリングして使い、音声や文字起こししたデータはアプリ内に貯まっていく。AIによる文字起こしや分析なども、アプリ側。ハードウェアは、あくまで音を集めるための道具だ。そのため、操作はシンプル。長押しして録音を開始し、もう1回長押しすると録音が停止する。こうしたシンプルな操作体系は、昔からあるボイスレコーダーとさほど変わらない。

 便利なのが、付属のケースがiPhoneのMagSafeや、マグネット固定が可能なQi2に対応していることだ。iPhoneシリーズやPixel 10シリーズの背面に貼り付けて持ち運べるだけでなく、そのまま通話の録音にも利用できる。元々本体が非常に薄いため、背面に貼り付けておいてもあまり邪魔にならないのがいい。

付属のケースはマグネットでスマホに装着可能。iPhoneやPixel 10シリーズなら、そのまま本体に取り付けられる

 特に筆者は今回、iPhone Airとペアにする形でPlaud Note Proを試したが、元々本体が薄いこともあり、持ち運ぶ際に違和感がなかった。スマホの近くにあれば、録音を開始したあと、すぐにアプリを開いて音声だけでなく、メモや写真を追加しながら記録を作っていくことが可能。常に持ち運ぶスマホと一緒なら、Plaud Note Proだけを忘れてしまう心配も減るはずだ。

元々ボディが薄いiPhone Airとはベストマッチ。厚みがそこまで増さないこともあり、装着時でも使いやすい

 難点は、充電に専用端子を使っていること。こちらにも磁石が使われており、近づけるとパチッと止まる形で付け外しはしやすいが、USB Type-Cではないのが残念。出張などの際にはケーブルを持ち運ばなければならない。3日間連続で各1~2時間使ってもバッテリーは20%程度しか減らなかったため、そこまで頻繁に充電する必要はないものの、いざという時にケーブルがなくて困るのは避けたい。

充電は専用端子で行う。ケーブルを持ち歩かなければならないのが、少々面倒だ

 とは言え、この薄さはすでにUSB Type-Cの端子以下。充電端子を変えると、本体の厚みが増してしまうおそれもある。今後、後継機を出す際には、ぜひワイヤレス充電に対応してほしいと感じた。ワイヤレス充電であれば、Pixelシリーズなど、一部のAndroidスマホでリバースチャージもでき、いざという時に充電しやすい。仕様として、ぜひ検討してほしい。

文字起こしはまずまずの精度、間違いはあるが中身は読み取れる

 録音した音声はいったんペアリングしたスマホ側に転送される。その状態で、「生成」ボタンをタップすると、テキスト化を行える。生成時には、「自動生成」と「カスタム生成」を選択可能。自動生成は、文字起こしだけでなく、要約の作成などまでまとめて行うためのもの。カスタム生成を選ぶと、テンプレートの選択や話者ラベルの有無、AIモデルや言語などを手動で選択できる。

録音が終わると、自動でハイライトが生成される。この状態で「生成」をタップすると、「自動生成」と「カスタム生成」の選択肢が出現
「カスタム生成」を選ぶと、AIモデルの選択など、細かな設定をすることが可能だ

 日本語で録音した音声をとりあえずテキスト化したい時には、複雑なことを考えず、自動生成を選べばいい。クリックしたあと、サーバー側で文字起こしや要約などが行われて、しばらくするとその結果が表示される。50分程度の音声で試したところ、2、3分の時間がかかったが、そこまで待たされる心配はない。

テキスト生成にはやや時間がかかるが、50分の録音は2、3分で完了した

 テキスト化が終わると、画面上には「録音ハイライト」が表示され、中身の概要が示される。今回試したのは、ソフトバンクとノキアが6Gの周波数として7GHz帯を使う実証実験をした際のイベントを録音したものだったが、ハイライトだけでも、かなりその中身が正確であることが分かる。「要約」タブをタップすると、順を追って何が話されたかを解説してくれるため、ほぼここだけで内容が分かってしまう。

生成が終わると、録音ハイライトがより詳細になった。「要約」をタップすると、全体のまとめが表示される。内容は、かなり正確だ

 後から、録音した中身を振り返りたいときに、メモを読み返しながら録音を聞き直したりしなくても、ここだけ読んでしまえば完結するほどだ。また、画面上部のタブで「ソース」を選択すると、このハイライトや要約を作成するために使った文字起こしの結果を表示できる。記事などに、コメントのような形で正確に引用したい時には、このタブから内容を見ていく必要がある。

「ソース」を選ぶと、文字起こしそのものが表示される。ただし、単語レベルでは、ところどころ間違いもあった

 文字起こしの結果を見ると、ところどころに単語の間違いはある。例えば、「ミッドバンド」という中間程度の高さの周波数を示すワードが「ミットアート」になっていたり、「トラフィック」が「トラビット」になっていたり、「収容できなくなる」が「終了できなくなる」になっていたりといった具合で、大元の話を聞いていないと、推測が難しい間違いもあった。

 試しに、Pixel 10で録音した同じ部分と見比べてみたが、「ミッドバンド」や「ミットマット」、「収容」はやはり「終了」になっていたものの、「トラフィック」はきちんと「トラフィック」になっていた。間違える箇所の傾向は近い。ただし、どちらも大元の話を聞いていれば間違いから推測して復元は可能。取りこぼしも少ないため、手動で頭から文字起こししていく時間は大幅にカットできる。

Pixel 10の方が正確なところもあった一方で、別の個所では間違いもあった。精度にそこまで決定的な差はない印象だ

 精度的には五十歩百歩のような印象だったが、Plaud Note Proの方がより、文章としてつながっていたほか、話者を分離しているため、誰が話したのかを思い出しやすい。Pixelのレコーダーにも同様の機能は搭載されているが、日本語には非対応。複数の話者が出てくるイベントなどを録音した際に使い勝手がいいのは、圧倒的に話者識別ができるPlaud Note Proだ。

自動付加の概要や質問機能が活用に役立つ、リアルタイム性は課題か

 後から内容を振り返る際に便利なもう1つの機能が、「概要」を自動で付加してくれること。話の中身を分析し、テーマごとに何分から開始されているかが文字起こしの冒頭で表示される。中身が細かく分かれているため、聞きたいもしくは読みたいところをタップするだけでいい。部分的に録音を聞き直したいときに、特に便利だ。

目次のような概要を作ってくれるため、聞き返したいところにすぐ飛べる

 また、要約などの「ノート」を元に、AIに必要なことだけを質問できる機能もある。例えば、KDDIの「auバリューリンク マネ活2」の発表会を文字起こしした要約を元に、「KDDIがマネ活プランを強化する狙いは?」と尋ねてみたところ、以下のような回答を得られた。

「KDDIがマネ活プランを強化する狙いは、顧客の投資や貯蓄へのニーズの変化に対応し、auじぶん銀行の価値を伝え、利用を促進することにあります。また、通信の顧客基盤の上に金融サービスを組み合わせることで独自の経済圏を構築し、他社との差別化を図るとともに、短期的な販促競争ではなく、既存顧客が長期的にサービスを使い続けられる環境を提供し、ロイヤルユーザーを確保することも目的としています」

生成したテキストや概要に対して、質問をすることも可能だ。必要な情報を引き出したい時に活躍する機能と言える

 ややあっさりとした回答だが、趣旨は合っている。さらに、その根拠となる部分へのリンクも表示される。使い勝手はグーグルが提供している「NotebookLM」に近いが、録音からテキストの生成まで一貫してアプリ内でできるのが大きな違い。後からファイルを手動でアップロードする必要がない。録音をすることで、作業に必要なデータベースが自動でできていくような感覚だ。

 ここまでのことは、通常のボイスレコーダーはもちろん、Pixelに搭載されたレコーダーアプリでもやってくれない。文字起こししたテキストやその元になった音声を活用する際に困ることを、AIできちんと解決してくれている印象を受けた。使い勝手は非常にいいと評価できる。

 ただし、録音後に後からテキストを生成する仕組みのため、録音中に文字を確認することはできない。この点は、リアルタイムかつオンデバイスで文字起こしが可能なPixelシリーズのレコーダーアプリとの違いと言える。

Pixelシリーズのボイスレコーダーは、リアルタイムの文字起こしが可能。その場ですぐに確認したいときに便利だ

 筆者の場合、数字を聞き逃した時のチェックとして、文字起こし中のPixelの画面を見ることがある。また、英語で文字起こしをしておき、聞き取れなかった単語や文章をその場で確認して、理解を深めるためにも活用している。後からの文字起こしでは、このような使い方はできない。

 また、オンデバイスAIで端末代以外の料金がかからないPixelのレコーダーとは違い、Plaud Note Proは、1カ月300分(5時間)以上の文字起こしは有料になってしまう。月1200分(20時間)のプロプランが年間1万6800円、無制限プランが年4万円かかる。毎日1時間程度しっかり使うのであれば、プロプランは必須になってくる。それ以上の価値はあるサービスだが、プロプランでも時間に制限があることは念頭に置きながら使うようにしたい。

文/石野純也

慶應義塾大学卒業後、宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で活躍。『ケータイチルドレン』(ソフトバンク新書)、『1時間でわかるらくらくホン』(毎日新聞社)など著書多数。

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2025年11月14日(金) 発売

昭和レトロvs平成レトロ、あなたはどっち派?DIME最新号は、「ヒット商品クロニクル」大特集!あの頃、我々の心を掴んだ人、モノ、コト、懐かしのCM。計300点のロングセラーで学ぶ〝温故知新〟!

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。