小学館IDをお持ちの方はこちらから
ログイン
初めてご利用の方
小学館IDにご登録いただくと限定イベントへの参加や読者プレゼントにお申し込み頂くことができます。また、定期にメールマガジンでお気に入りジャンルの最新情報をお届け致します。
新規登録
人気のタグ
おすすめのサイト
企業ニュース

京セラが会話の内容を字幕として生成・表示させる「わかりやすい字幕システム」を発売

2023.08.27

発した言葉が次々にテキスト化され、透過型スクリーンに字幕として投影されていくーー。そんな近未来的なシステムが、京セラドキュメントソリューションズから8月17日に発売された。

話した言葉をリアルタイムでテキスト化して字幕で表示

コロナ禍では、公共施設や病院、ホテルなどの受付にアクリル板が立てられ、この状態でマスクをしたまま会話すると、声が聞き取りづらくて難儀することが多かった。しかし、考えてみれば、聴覚障害者や耳が遠くなったお年寄りは、コロナ以前からずっと同じような不便を強いられてきたと言える。

受付や案内所などで仕切板ごしの会話が聞き取りづらいという問題を解決するのが、京セラドキュメントソリューションズが8月17日に販売開始するリアルタイム字幕表示システム「Cotopat(コトパット)」である。

写真を見ていただければ一目瞭然だが、アクリル板の向こう側にいる女性が話した言葉が、リアルタイムでテキスト化され、透過型のスクリーンに表示されるというシステムだ。YouTubeの動画などでは、音声認識により字幕を生成する機能があるが、あれがリアル世界での会話で表示されるようなイメージである。話した言葉が次々にテキスト化されて浮かび上がる様には、近未来感を感じる。

コトパットのシステム構成は、アンドロイド(OS)を搭載したプロジェクターと、透過型の表示スクリーン、マイク、操作用のテンキースイッチなどから成る。マイクから音声が入力されると、プロジェクター内のアプリがWiFiを経由して音声データを専用サーバに送り、テキスト化してスクリーンに表示する。

アンドロイドOSを搭載するプロジェクターが、入力された音声を専用サーバに送ってテキスト化して表示

音声をテキスト化するアプリはすでに実用化され、スマホなどで利用されているが、句読点もなくだらだらと日本語を流して表示するものが多い。しかし、コトパットの場合は、文脈から同音異義語や文節の区切りを判別し、句読点もちゃんと打ってくれるので、非常に読みやすい。

「横浜市中区役所や同志社大学、JR新宿駅などで実証実験をしていくなかで、ある実証実験先で、話された言葉と文字化されたデータを突き合わせたところ、正答率は96%を超えていました。これは実運用上の数字で、一般に実験室レベルで99%を謳っているようなシステムと同等以上と認識しています」(京セラドキュメントソリューションズジャパン マーケティング統括部大阪第1マーケティング部部長・原康二氏)

実際に実物で試したところ、変換の精度はかなり高いように感じた。

スクリーンに表示できるのはテキストだけではない。図や動画の表示も可能だ。たとえば、「清水寺」という単語をあらかじめ登録し、動画と紐付けしておけば、観光ガイドが案内時に「清水寺」という言葉を発しただけで、テキスト上で「清水寺」が強調表示され、自動で登録した清水寺の動画を流すこともできる。

単語を登録して画像や動画と紐付けしておけば、その単語を発話するだけで画像や動画が表示される

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2024年4月16日(火) 発売

DIME最新号は「名探偵コナン」特集!進化を続ける人気作品の魅力、制作の舞台裏まで徹底取材!

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。