データマイニングの分析手法
データマイニングではデータ収集・加工を行った後、『特定の手法』を用いて分析を行います。よく用いられるのは、『ロジスティック回帰分析』『マーケット・バスケット分析』『クラスタリング』の三つです。
ロジスティック回帰分析
『ロジスティック回帰分析』は、『物事が発生する確率』の予測や分析ができる手法です。とりわけ、YESとNOが明確に定義されている事象に対し、それが起こる確率を予測することに長けています。
小売業においては、販売促進を目的とした『キャンペーンの反応率』を見るために使われるケースが多いです。
顧客の年齢層や過去の購入履歴のデータを用いて分析を行えば、『DMを送ったときに商品を購入する確率』が導き出せるでしょう。購入確率の高い顧客を狙ってDMを送るようにすれば、ランダムにDMを手配するより成果が出やすくなります。
予測は外れることもありますが、人間が予測するより当たる確率ははるかに高いです。
マーケット・バスケット分析
『マーケット・バスケット分析』とは、単体ではなく『よく一緒に買われる商品』を見つけるためのデータ分析です。
マーケット・バスケットは直訳すれば『買い物かご』ですが、ここでは『1人の顧客によって1回買い物が行われた際の商品購入データ(レシート)』を指します。
データを細かく分析することで『購買意欲のパターン』を導き出せるため、小売店やECサイトのおすすめ機能などに活用されるケースが多いです。
マーケット・バスケット分析を行う具体的な手法は複数ありますが、主に『アソシエーション分析』が用いられます。これは、『If(もしこうだったら)Then(こうなる)』というルールを設定し、事象間の関連性を分析する方法です。
クラスタリング
『クラスタリング』は、データを類似度に基づいてグループ分けする手法です。『クラスタ』の元の意味はブドウの房や集団ですが、クラスタリングにおいては『同じ傾向を持つ人のグループ』を指します。
似たような購買行動をする顧客をクラスタリングし、クラスタに最適なマーケティング施策を行えば、店舗の売上向上につながるでしょう。
ネットショッピングで『この商品を買った人はこんな商品も買っています』という表示が出る場合がありますが、これもクラスタリングの応用の一つです。
データマイニングを活用するポイント
データマイニングにおいては、『質のよいデータ』を使うのが基本です。見当違いの結果や意味不明な結果が出てきたときは、使用したデータに何らかの問題があった可能性が考えられるでしょう。
正確なデータを使用する
データマイニングを行う上で重要なのは『データの正確性』です。
分析に使うデータが悪ければ、どんなにデータマイニングを行っても意味がありません。正確で有益な情報を獲得するためにも、分析に使用するデータの質を保持しましょう。
ビッグデータを収集した後、データの加工・整形を行いますが、この時点で欠損や重複、無関係なデータはすべて弾いておくことが肝心です。加工では、分析するデータの形式をしっかりそろえるようにしましょう。
構成/編集部