人気のタグ
おすすめのサイト
企業ニュース

AIはどうやって作られる? 国内外のAI企業の変遷と今後の動向

2020.03.17

昨今、AI(人工知能)というワードを聞かない日はないというくらい、AIを搭載したサービスが身近に増えてきました。例えば、家の中で使用されることの多いスマートスピーカー、旅行予約のWEBサイトで活用されているチャットボット、空港に設置され始めた顔認証システムなど、普段の何気ない生活の中にもAI活用シーンが増えています。

企業においては、営業トークを分析して「売れる営業トーク」を導くAIや、建築物の破損や工場で欠陥品を判断するAI、当社でも提供している手書き文字を自動認識するAI OCRなど、デジタル化ニーズの高まりと共に、様々なAIサービスが提供・利活用され始めています。今後もDX(デジタルトランスフォーメーション)を進める技術として産業のAI化は拡大していくでしょう。また、昨年3月には政府もAI戦略(※1)を発表しており、AI人材の育成、産業活用、AI研究ネットワークなどを掲げ国としても注力を始めています。では、そもそもAIはどのように作られているのでしょうか?

企業が直面する課題はAIの「学習データの準備・投入」

一般的なAIを構築する流れとしては、AIのための学習データを準備し大量のデータを学習させます。その後、アルゴリズムと呼ばれるAIモデルを構築し、想定に沿ったものになっているか評価や検証をします。そして、そのモデルを活用してアウトプットを行う、といった流れになります。昨今、AI人材が不足しているとよく言われますが、企業が自社のAIサービスを構築する上で実際に直面する課題は、AIの「学習データの準備・投入」が非常に多く挙げられます。

2018年に総務省が発表した、平成30年版 情報通信白書(※2)においても国内企業の課題は「データ収集・整理が不十分」であると記載されています。AIの「学習データ」とは一体どういうものかというと、人間の子供が親から「これは○○だよ」と様々なことを教わりながら成長するのと同様に、AIも学習データを元に対象物の判断方法を学んでいきます。この学びを与えてくれる教科書のようなものを「学習データ」と言います。そして、AIが学ぶためには膨大な量のデータが必要であり、これを用意することが多くの企業にとって現実的な課題となっているのです。

単に学習データといっても、なかなかイメージされにくので、ここでいくつかご紹介してみます。自動運転であれば、自動車から見える景色の画像を元に「これは車」「これはトラック」「これは白線」といったように一つひとつの画像に情報がタグ付けされたデータのことを指します。

手書き文字を自動認識するAI OCRの学習データでは、多種多様な書き方をされている手書きの文字データに「これは【の】」「これは【あ】」などと、一つひとつの文字画像に正しい文字データ情報を紐付けしていきます。このように作られた大量の学習データをもとにAIが学習し、様々な手書き文字を認識できるようになるのです。他にも、スマートフォンやスマートスピーカーに搭載されるような音声自動認識では、音声データと正確な言語情報とを紐付けたものものが学習データとなります。

「アノテーション」の重要性

これらの、画像・音声・文字などの対象となる情報と正しい情報を、AIが学習できるよう紐付けたデータセットの作成を「アノテーション」と言います。学習データの必要量は、提供するサービスや活用用途によって変わるため、一概にどれだけとは言えません。画像情報を元とした学習であれば、最低でも1,000〜10,000枚は必要になると言われており、その必要量に対してアノテーション作業を行うことになります。

すでに、このアノテーション作業を各企業が行わなくても良いように一般公開されている学習済みデータセットも存在します。今年の1月にはGoogleが、一般公開されているデータセットを検索できるサービスを発表しました。しかし、現段階では、実際に企業が活用しようとしても本当に必要なデータが無い(学習対象としたい対象情報のデータセットが存在しない)というケースも多く見られます。その場合、企業が自らAIの学習データを用意することになるのですが、学習データを作るアノテーション作業は基本的にすべて人力での作業になります。結果として、これらを大量に実施することが難しく、企業がAI構築に二の足を踏む要因になっています。AI活用のニーズを持つ多くの企業が、情報通信白書に挙げられた課題に直面しているのです。

その一方で、アノテーションを請け負うサービスの提供も始まっています。海外ではすでにアノテーションの需要が高まりを見せ、大手ではAmazon Mechanical TurkやFigure Eightなどがアノテーションサービスを提供しています。2019年には、Figure Eightはオーストラリア証券取引所に上場しているAppenに最大3億ドルで買収される動きもありました。Scale AIという2016年設立の企業も、1億ドルもの資金調達に成功しています。他にも、アノテーションに対応したSaaSツールは多数登場しており、この市場は2025年までに16億ドル市場にもなる、という予測をしている企業もあります。

日本国内でもアノテーションサービスの提供企業が出てきており、当社もそのひとつです。当社では、自社のクラウドソーシングネットワークなどを活用し、この膨大なアノテーション作業をこなせるエコシステムを構築しています。そして最近では、アノテーションの前段階となる、世の中の建物・道路などの撮影データを集めたいといった相談も増加傾向にあります。

これからますますAIが普及する中で、海外同様に日本でもアノテーション市場や関連市場は今後拡大していくでしょう。また、企業内でのAIサービス構築において学習データやアノテーションの課題が出てきた際は、本記事なども参考にしていただければ幸いです。

※1:https://www.kantei.go.jp/jp/singi/tougou-innovation/pdf/aisenryaku2019.pdf
※2:第1部 特集 人口減少時代のICTによる持続的成長(AIの導入にあたっての課題)より
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h30/html/nd132220.html

文/森下佳宏
岐阜県瑞穂市出身。株式会社ユニメディア ANNOTEQ事業責任者。
アメリカ留学を経てユニメディア入社。WEBマーケティング営業、企画を担当。その後、モンゴルでソフトウェア開発子会社、及びクラウドソーシング事業を立ち上げ。マイクロタスク型クラウドソーシングとして日本最大級の規模を持つネットワークを構築。ヒト×テクノロジーで企業のDXを実現するデジタルBPOや、AI OCR「LAQOOT」といった多くのプロダクトの開発〜販売までを実施。株式会社内職市場の取締役を兼務し、現在はAIモデルの構築を支援するアノテーションサービス「ANNOTEQ」を推進している。

新型コロナウイルス対策、在宅ライフを改善するヒントはこちら

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2020年7月16日(木) 発売

DIME最新号の特別付録はミクロの世界を楽しめる「90倍スマホ顕微鏡」!特集は「家ナカ オフィス改造計画」

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 10401024号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。