クロス集計

クロス集計とは、与えられているデータの内、全てのデータを使用するのでは無く、分析の目的により、そのデータ中から、幾つかのデータを分析対象として抽出し、集計する方法を言います。対象とするデータ項目は2項目が一般的ですが、3項目、4項目となる場合は「多重クロス集計」と言った呼び方もします。
 例えばビジネスにおいて商品やサービスの満足度を分析したい場合に、満足度調査アンケートを行うことがあります。この様なアンケートでは満足度の調査項目と性別や年齢などの項目も同時に取得することが一般的です。満足している人が全体の何%かを知るだけなら、満足している人の数だけを集計するだけで良いのですが、どのような人が満足しているかといった人の属性までを考慮して満足度を把握するには、性別や年齢別に満足度を集計し、その結果を分析する必要があります。このようにデータ全体から複数のデータ項目を分析対象として抽出し、集計する方法をクロス集計と言います。
 現在では、分析ツールの普及により、様々な集計方法や関数が用意されており、目的に応じて選択し、利用できる環境になっています。分析ツールを使ってクロス集計を行い、その結果を有効活用することがビジネス、教育、研究などの分野において求められています。

(2016年09月14日 初稿)

English

Cross tabulation

定義

クロス集計とは、様々なデータ分析を行う際のデータ集計方法の1つです。目的とする集計結果を導くため、全てのデータの中から複数のデータを抽出して集計する方法です。