小学館IDをお持ちの方はこちらから
ログイン
初めてご利用の方
小学館IDにご登録いただくと限定イベントへの参加や読者プレゼントにお申し込み頂くことができます。また、定期にメールマガジンでお気に入りジャンルの最新情報をお届け致します。
新規登録
人気のタグ
おすすめのサイト
企業ニュース

ヒジネスシーンでよく使われる言葉「データマイニング」とはどんな意味?

2021.03.06

『データマイニング』は、ビックデータを解析する技術体系の一つです。一見、無関係と思われるデータから有益な情報や知識を多く得られるため、さまざまな分野のビジネスに活用されています。データマイニングの活用事例や分析方法について理解を深めましょう。

データマイニングを分かりやすく解説

情報の高度化が進み、日々大量のデータが生み出される現代、ビックデータを有効活用する手段として『データマイニング』が注目されています。

マーケティングや営業戦略など、ビジネスにおけるさまざまなシーンで活用できるため、手法を学ぶメリットは大きいでしょう。

大量のデータから必要な情報を抽出する手法

『データマイニング(DM)』とは、膨大なデータの中から有用な情報を抽出する技術体系です。『マイニング(Mining)』には「発掘」という意味があります。

具体的にいえば、統計学・パターン認識・人工知能などのデータ解析技術を大量のデータに適用し、そこから規則性や関連性などを自動的に見出すことです。

データマイニングの主な機能は、以下の三つに分けられます。

  • 発生確率を予測する
  • データを分類する
  • データ間の関連性を抽出する

また、テキストデータを対象としたものは『テキストマイニング』、Webデータを対象としたものは『Webマイニング』と呼ばれます。

活用されている分野

大量のデータから法則性や相関関係が発掘できるデータマイニングは、幅広い分野で活用されています。用途の一例を業種別で紹介しましょう。

『小売業』では、顧客データや購買データを分析することにより、『どの商品がどんな条件下で売れるのか』『売上が上がる商品の組み合わせは何か』といった法則性が見出せます。

売上予測の精度を向上させたり、顧客に適切なアプローチをしたりするのに役立つでしょう。

『製造業』では、需要予測や品質管理、設備の保全などにデータマイニングが活用されています。データ分析によって不良品や機械故障の影響因子を特定できれば、さまざまなトラブルが未然に防げるはずです。

『教育現場』においては、授業に対する学生の理解度や成績が予測できるようになります。指導者は効果的な指導戦略が立てられる上、特別なケアを要する学生を事前に特定できるでしょう。

このほか、金融・保険・医療・通信などの分野でも、データマイニングが活用されています。

データマイニングの手順

データマイニングは、データの『収集』→『加工』→『分析』→『検証』という流れに沿って行われます。それぞれのプロセスにおけるポイントや注意点について確認しましょう。

データを収集・加工する

データマイニングには、元となるデータの収集が欠かせません。データが多いほど有益な情報や知識は発見されやすくなるため、場合によっては『データウエアハウス(DWH)』を使うのも有用です。

DWHとは各種データを時系列に保存できる『情報の倉庫』のようなもので、データの上書きや削除は行わないのが原則です。長年、改変されずに積み上げられたデータの中には、多くの価値ある情報が眠っているといえるでしょう。

また、データマイニングを行う際は、初めに『目的の設定』を行うのが基本です。やみくもにデータを投入するよりも目的を明確化し、それに合ったデータを収集することで、より効果的なデータマイニングが行えます。

データ収集後は『データの加工・整形』を行います。データマイニングは主に分析ソフトを用いるため、データ形式が標準化されていないと正確な分析結果が得られません。

破損したデータや不正確なデータなどを除外した後、分析ソフトが扱える形式にデータを整えます。

分析・検証する

後ほど詳しく説明しますが、データマイニングの方法には、仮説を立てずに結果を導く『機械学習』と、統計解析のように仮説を立てて判断する『統計分析』の2種類があります。

それぞれの方法に合わせてデータ分析を行い、『パターンの発見』や『グループ化』などを行います。分析手法には、『クラスタリング』『ロジスティック回帰分析』『マーケット・バスケット分析』などを用いるのが一般的です。

分析実施後は、得られた結果を基に検証や評価を行います。

データマイニングの種類

データマイニングには『統計分析』と『機械学習』の二つの方法があり、どちらを選択するかによって得られる結果も変わります。それぞれの特徴を比較してみましょう。

統計分析

『統計分析』は、統計学や確率論を活用する方法です。

統計解析と同じように、事前に仮説を立てた上で必要なデータを集め、検証するものに合わせて分析手法を選びます。あくまでも仮説に基づいて分析や判断が行われるため、予想と結果が大きくずれることはほとんどありません。

分析の結果、仮説が間違っていた場合は『仮説の設定』→『情報収集』→『分析』を何度も繰り返します。

この方法を実行するには、統計学に関する専門知識が必要です。近年は、知識不足を補ってくれる優秀なデータマイニングツールも多く出ていますが、最低限の知識は身につけておいた方がよいでしょう。

機械学習

事前に仮説を立てる統計分析に対し、機械学習は仮説を必要としません。人工知能(AI)が自分で学習しながら、膨大なデータの中から相関性や法則性を導き出します。

別名『知識発見型』とも呼ばれ、思いもよらなかった新たな発見や知識を得られるのが特徴です。人間ではできないような、複雑な条件が絡む課題の分析にも長けています。

ただ、出てきた結果に必ずしも有用なルールが見出せるとは限らないのがデメリットです。

たとえば、『おむつとビールを一緒に陳列すると売上が上がる』という結果が導き出されたとしても、「それはなぜなのか?」という理由は人間が考える必要があります。

@DIMEのSNSアカウントをフォローしよう!

DIME最新号

最新号
2024年11月15日(金) 発売

DIME最新号は「2024年ヒットの新法則!」、永尾柚乃、小田凱人、こっちのけんと他豪華インタビュー満載!

人気のタグ

おすすめのサイト

ページトップへ

ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。詳しくは[ABJマーク]または[電子出版制作・流通協議会]で検索してください。