テキストマイニング

テキストマイニングは、データマイニングの技術を利用して、膨大なテキストデータの中から重要な意味を持つ単語や単語間の関連性を見つけ出すために行われます。その際に、自然言語処理によって文章を単語や文節に分解します。文章を分解することにより、それぞれの単語が名詞なのか、動詞なのか、助詞なのかを明確にすることが出来、データマイニングの精度向上に繋がります。

テキストマイニングは、コールセンターでの問い合わせ対応やアンケート結果の解析の場面などで効力を発揮します。コールセンター業務における音声での顧客とオペレーターとのやりとりをテキストデータに変換し、テキストマイニングを行います。それにより、音声での通話記録では明らかにしづらかった頻出単語の抽出が可能になり、ある内容の問い合わせをする顧客が行いやすい別の問い合わせの傾向なども把握することが可能になります。これらの解析結果は、より顧客にとって分かりやすいコールセンター業務への改善に活用されています。この技術は空間情報の分野でも活用されており、ウェブサイト上のテキストデータの中から地名(住所や建物名など)のデータを抽出し、ウェブコンテンツを空間情報と紐付けるために使われることがあります。

(2015年11月18日 初稿)

English

Text Mining

定義

テキストマイニングとは、テキスト(文字列)データを対象にしたデータマイニングのことをいい、文章などのテキストデータを自然言語処理によって単語や文節に分解するとともに解析を行い、単語間の関連性や頻出単語の抽出などの有用な価値を見つけ出すために利用されています。