人気のタグ
おすすめのサイト
企業ニュース

原稿作成時間が3割減!仕事のスピードを加速させる音声入力のススメ

2019.05.28

今回で3冊目となる著書『謝罪の極意』(小学館)を、6月12日に刊行することになりました。私は今、週休3日を実践しながら、コンサルティングや講演もこなしつつ、複数の執筆作業も同時に進めています。そこで、今回は徹底的に効率化を図り、音声による文字入力とクラウドによる共同作業を活用したところ、数か月で完成させられました。今回はその詳細について紹介します。

最近のテクノロジーを支えている「AI」は「予測」「行動」「認識」を得意としています。過去のデータをもとに未来を「予測」し、自動運転などの「行動」を支援し、様々な「認識」によって我々の生活をラクにしてくれるのです。

この「認識」には「見て判断する」「聞いて判断する」「言語を操る」という特性が含まれます。中でも「見て判断する」で有名なのが「顔認証」。例えば、パナソニックが羽田空港の入国審査場に納入した「高性能顔認証ソリューション」は、パスポートの顔写真データと実際の顔をAIが照合し、各種手続きを自動化しています。

そして「聞いて判断する」と「言語を操る」の特性を利用したものが、おなじみになってきた「AIスピーカー」や「自動翻訳サービス」になります。この2つの特性が、まさに今回の著書における文章作成に大きく貢献してくれました。

活用方法1/録音データを文字に変換する

私が講演を行なう際、ICレコーダーで必ず録音を取ります。その音声データをPCに取り込み、Google CloudやIBM WatsonなどのクラウドおよびAIサービスを使って、テキストに変換しました。具体的には「Speech to Text API」というツールを利用したのですが、音声データから変換された文字が、画面上に次々と羅列されていく様子は実に爽快です。同音異義語を除けば、漢字変換の精度の高さにも目を見張るものがあります。

このような音声変換機能は、いくつかのクラウドサービスやWebサイトで試用できるようになっています。無料のものもあり、1分程度の録音データならアップロードすると即座に文字に変換してくれます。ぜひ、お試しください。

Google Cloudの場合)

活用方法2/スマホに話しかけて文章を書く

デバイスに話しかけて操作するといえば「OK Google!」や「アレクサ!」などのAIスピーカーを思い出される人も多いでしょう。それと同じような感じで、スマホやタブレットに向かって話しかければ、音声を文字データに変換することができます。

『iPhone』でのフリップ入力も便利ですが、音声入力はそれ以上に素早く文字を入力できます。『iPhone』の標準機能である音声入力は、各アプリで文字を入力する時に現れる、キーボード内の「マイク型ボタン」を押すだけで実行できます。

私が『iPhone』を使い始めて3年以上経ちますが、100文字を指先でフリップ入力する場合は1分程度かかります。これに対して、100文字を読み上げて音声入力すると41秒で済みました。長い文章を音声入力で作成する場合、変換精度などの関係で修正作業が必要な場合もありますが、移動中や出張先で思いついたことをすぐに控えたい時は手軽で便利です。

もちろん、PCでも音声入力が簡単にできます。今回の執筆でも、キーボード入力と併用しながら効率的に文章を作成していきました。音声入力はスマホやPCに向かって話しかけるので、騒がしい場所や周囲に人がいる場合は相応しくないかもしれません。ですから、状況に応じて使い分けるようにしましょう。

<iPhoneで音声入力する画面>

もし上記の音声入力ボタンが表示されなければ、iPhoneの音声入力を有効にするという設定をしてみてください。

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2019年9月14日(土) 発売

DIME最新号の特別付録は「デジタルスプーンスケール」!さらに激変するスマホの大特集に最新iPhone情報も!

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 10401024号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。