データマイニング

データマイニングの代表的な事例として「オムツとビール」というものがあります。これは、スーパーマーケットでの購買データを解析したところ、「オムツを購入する人は併せてビールも購入することが多い」という、一見関連の見えないオムツとビールに購買の相関があることが発見され、オムツとビールをセットで陳列した結果売上が大きく伸びた、という話です。このように、大量のデータに対して解析処理を行い、一見関連や相関があるとは思えないような新たな価値を持つデータ間の関連性・法則・相関等を見つけ出すことをデータマイニングと言います。ITの進歩によって大量のデータを蓄積し、かつ、それらを解析処理することが可能になったことから、次第に広告業界の分野などで盛んに利用されるようになりました

私達の身近なところでは、通信販売のサイトで「この商品を購入した人はこんな商品も購入しています」と別の商品を紹介されることが多くありますが、これも大量の購買データやサイト内の閲覧履歴などを解析し、関連性の高い商品を見つけ出すというデータマイニング技術を利用することで実現しています。

今までは、テレビCMや新聞広告などで多くの人に同一の情報を提供するのが広告の主流でしたが、データマイニングの技術やインターネット・スマートフォンの普及により、現在は一人一人の好みや属性(性別、年代など)に応じた情報を提供することでより効果の高い広告を届ける仕組みが増えており、広告のあり方も時代とともに変化しています。

(2015年11月18日 初稿)

English

Data Mining

定義

データマイニングとは、大量のデータに対して解析処理を行うことにより、通常では想定できなかったような新たなデータ間の関連性や法則等を見つけ出す技術のことを言います。「マイニング」は「Mine=(鉱石などを)採掘する」、に由来しており、鉱山の中から価値の高い鉱石を見つけ出すかのように、様々な解析処理を行うことで大量のデータの中から新たな価値を見つけ出す取り組みが、近年盛んに行われています。