「データサイエンティスト」という仕事をご存じだろうか。ビッグデータの解析が必要となった近年、様々な意思決定局面において、データをもとに合理的な判断が下せるよう、意思決定者をサポートする職務と、それを遂行する人間のことだ。2010年以降、知られるようになった言葉だが、その注目度や関心は益々高まり、高給が期待できる分野といわれる。今回登場するのは部長職。シリーズ「部長のヨワネ」の連載ではあるが、データサイエンティストの職務内容について多くを割いた。
シリーズ第2回 株式会社ブレインパッドアナリティクス本部、アナリティクスサービス部長 シニアリードデータサイエンティスト 紺谷幸弘さん(38)。04年設立のこの会社の事業内容は、企業の経営改善を支援するビッグデータ活用サービスとある。紺谷さんが入社した10年ほど前は、従業員数60名ほどだったが現在380名。現在、部長職の彼はおよそ100名の部下を監督している。
データサイエンティストとは?
大学院で統計学を専攻した紺谷幸弘が、ベンチャー企業を選んだのは、統計の知識が生かせて、いろんな経験ができるだろうと考えたからだ。
「データサイエンティストにはビジネスの課題を整理し解決する力。統計学等の情報科学系の知識を理解し使う力。意味のある形に使えるようにし、実装運用できるエンジニアリング力、この3つをこなせる能力が必要」とは、この会社の代表者の言葉だ。
入社した当初の印象深い案件である、外食チェーン全店の翌月の売上げ予測は、分析と解析を駆使した仕事であった。
「1日単位で、全店の売上げの誤差を5%以内に収めるよう予測をする、それがオーダーでした。より正確に予測ができれば、在庫や仕入れに関して事前に手が打てます」
既存の膨大なデータの数字を分析する。まず売上げ予測が当たった日と、はずれた日に共通の特徴はないか、調べる作業だ。うまく予測できなかったモデルを見ていくと、「あれ?」紺谷はナゲットの売上げの数字に注目する。
「例えばナゲットを100円で安売りした日は、300万円の売り上げ予測が400万円になったり。安売りしない日は280万円だったり。ナゲットはインパクトのあるプロモーションだったので、全体の予測に対する影響が大きかったんです」
そこで、ナゲットのキャンペーン時の数字を取り出し分析して予測を出した。そして通常料金の時とキャンペーンの時と、ナゲットの売上げの予測数字を入れ替え、売り上げ予測に反映させたのだ。結果、1日単位で全店の売上げ誤差5%以内という、クライアントのオーダーを満たすことができた。
ポータルサイトとの深い関係
データサイエンティストの能力の一つ、エンジニアリングは、ソフト等の制作も含めデータの加工が適切にできることと彼は言う。例えば離乳食の製造過程で、ベルトコンベアで流れてくる刻んだポテトの中から、不良品を検知して取り除き、問題解決のための手順や計算方法の構築。画像解析の手法を使い、データをもとに作ったアルゴリズムが、カメラが撮った画像から不良品を探知する。
――しかし、データサイエンティストはビッグデータの存在がないと、活躍できません。その点、Yahoo!との信頼関係は大きい。Yahoo!とのパイプはどう開拓されたのですか。
「僕の一つ年上の先輩が、Yahoo!の仕事に携わったことがきっかけでした。先輩はお客さんのニーズをつかむのが上手かった。Yahoo!に限らずポータルサイトの広告の売上げは、Web上の広告をクリックしたときに、広告主からお金が入る仕組みです。だからポータルサイトは、どれだけクリックしてもらうかに集中する。でも広告を出す方の関心は閲覧者による商品購入や会員登録、資料請求、つまり収益に結びつくコンバージョンです。
『クリックばかり上がっても、コンバージョンが上がらなければ、広告を出す人の数は減りますよね』先輩はそんな問題点を話し合ったり。広告主がビジネスをする上で何が重要か、そこを提案して、それに沿った分析を提示したんです」
そうして徐々にYahoo!との信頼のパイプを太くして、自社の多くのデータサイエンティストが、仕事に携わるようになる。やがてYahoo!から業務を受託する形で提携を継続している。
アクションの手前までお客を連れていく
紺谷は言葉を続ける。
「『アクションに繋がらないと意味がない』とは、その一つ年上の先輩の言葉です。お客さんの会社がターゲットとする層を分析して、“ターゲットの性格はこうです、はい終わりです”じゃ、意味がない。クライアントのビジネスに何も貢献していないじゃないかと。分析の結果を踏まえて、お客さんが次のアクションを起こす手前まで、我々は責任を持ってお客さんを連れていく」
例えば、Web広告を出稿するダイレクト保険会社の案件は、「バイク保険に加入してもらえそうな人に、アプローチしたい」というオーダーだった。そこで、バイク保険の見積もりを完了しているユーザーに注目した。
検索エンジンの検索結果に、広告が表示される、リスティング広告を試みる。
まずバイク保険の加入者がよく検索する単語を、ポータルサイトの膨大なデータから探っていく。個人ユーザーがバイク保険に加入する3か月前から、加入して1か月後まで丁寧に見ていく。その一方で、バイク保険の加入者全体の大まかな傾向も見る。
バイク保険の見積もりが完了しているかどうかも、注目する要素だ。そこも踏まえて、個人と全体のデータを繰り返して見て、分析の作業を続けると、バイク保険のユーザーに刺さる言葉が浮き出てくる。
それは“引っ越し”と“駐車場”という言葉だった。
「この二つの単語に出稿したほうがいいんじゃないですか」と、クライアントにアドバイスをした。それによって、検索エンジンで“引っ越し”“駐車場”と検索したことがあるユーザーの広告表示面には、ダイレクト保険会社の広告が掲載されることになるのだ。
「この案件ではお客さんがアクションを起こす手前まで、我々が連れて行った形になりました」
紺谷はデータサイエンティストならではの仕事の一例だと語る。
後編では100名のデータサイエンティストを束ねる部長ならではの逸話、そしてデータサイエンティストの真骨頂とは何かを紹介する。
取材・文/根岸康雄
http://根岸康雄.yokohama