ならば、滑舌のしっかりしたアナウンサーのしゃべりではどうかと、パソコンの「radiko」やYouTubeを再生して、録音してみた。パソコン内蔵のスピーカーよりも音質の良いBluetoothスピーカーからの音を録ってみたのだが、結果から言うと全滅。音声の帯域の問題なのか、周囲のノイズの問題なのか、はっきりとした原因はわからないが、ほとんどエラーに終わってしまった。
現時点での結論
誤変換されていない部分を、手動で修正するにしても、インタビュー原稿のように長く、正確に再現しなければならない用途では、ちょっと難しいかもしれない(後日、8人ほどが参加する取材で使用してみたところ、ほとんど使い物にはならなかった)。最初からキーボードで入力するのと、間違いを見つけて修正する手間・ストレスのどちらが大きいかわからない。ただ、会議や講演などのメモとしての利用なら実用的かもしれない(音声がきちんと取れること、話し手の滑舌が良いことという条件付きで)。文章としては破綻していても、単語単位ではかなり正確に認識しているからだ。自分がその場にいたのなら、ざっくりと内容を思い出すことくらいは可能だろう。
文/小口 覺(おぐち さとる)
IT、SNS、スマートフォン、ネット、家電、ガジェットからサブカル、ビジネスまでゆる~くカバーしているライター。 Twitter@oguyan