クロス集計は、アンケート調査を集計する上で最もよく使われる手法の一つです。クロス集計は、2つ以上の質問項目をかけ合わせ(クロス)したうえで、回答者の属性ごとに違いや特徴を見出すために使用します。この記事では、クロス集計の種類や特徴、メリット・注意点などについて、マーケティングリサーチ会社として解説していきます。
目次
クロス集計とは
クロス集計とは、アンケート調査やマーケティングリサーチの集計の1つです。
2つ以上の質問項目の結果を掛け合わせて(クロスして)比較することで、調査データを細分化して把握可能にする集計方法です。
単純集計との違い
単純集計とは
クロス集計を行う前に、まず単純集計を行う必要があるため、単純集計について解説していきます。単純集計とは、アンケート集計において最も基本的な集計方法です。
アンケートの設問毎に回答結果のローデータを集計し、回答の人数、各選択肢の内訳の人数と割合を表示する手法です。下記のような表を単純集計表、GT表(Grand Total表)とも呼びます。
▼製品への満足度調査の単純集計(GT)表の例
Q:製品に対して、総合的にどのくらい満足していますか | % | |
1 | 大変満足 | 20% |
2 | 満足 | 52% |
3 | どちらともいえない | 19% |
4 | やや不満 | 6% |
5 | 不満 | 3% |
全体 | 100% |
単純集計のメリットは、表を見ることで回答全体の傾向をわかりやすく読み取ることができる点です。デメリットは、回答結果の全体的な傾向しかわからないことです。
例えば、「年代別に満足度に違いはあるのか」「地域別に満足度の傾向はあるのか」といった点は、単純集計だけでは判断ができません。
属性ごとの詳細な傾向を確認するために使用するのが、クロス集計です。
クロス集計の具体例
クロス集計では、2つ以上の質問項目の結果を掛け合わせて比較していきます。
集計表の横側(左側)を「表側(ひょうそく)」、上側を「表頭(ひょうとう)」と呼びます。
例えば先ほどの、満足度を年代別で掛け合わせた表が下記になります。
もちろん年代以外にも、年齢や地域、職業といった様々な属性で掛け合わせることで、様々な視点から分析が可能です。
全体の傾向に対して、どのような項目で掛け合わせていくのか、が重要ですが、この視点のことを「分析軸」もしくは「ブレイクダウン」といいます。
例えば、下記表のように性年代を分析軸としてクロス集計すると、20代には高い満足度を得られているが、年齢が上がるにつれて満足度が下がっていることがわかります。
クロス集計の種類
属性クロス集計
属性クロス集計とは、文字通り回答者の属性ごとに集計して、回答の傾向を比較する方法です。
例えば、性別・年齢・職業・居住地などの属性でクロスすることが一般的です。
先程の年齢別の満足度も属性クロス集計の例になります。それ以外にも「男女で傾向に違いがあるのか」「職業の違いによる傾向の違いは何か」といった点を確認したい場合に、使用します。
設問間クロス集計
属性ではなく、アンケートの設問項目をかけ合わせて設問ごとの関係性を明らかにする集計です。
例えば、「商品の満足度」の設問と、「使用頻度」を聴取する設問を掛け合わせて集計すると、満足度と使用頻度の関係性を測ることができます。
具体的には、設問間クロス集計は二つ以上の設問の答えを一つの表にまとめ、それぞれの答えの組み合わせごとの回答者数(n)を表示します。例えば、「商品の満足度の5段階評価」と「使用頻度」という二つの設問があったとき、設問間クロス集計を行うと、使用頻度と満足度の関係性が見えてきます。
設問間をクロスさせるには、調査設計時に、どの設問を掛け合わせるのか事前に設計することをおすすめします。
多重クロス集計
多重クロスとは、3つ以上の変数間の関係を理解するために、3つ以上の設問を掛け合わせる集計です。
3つの設問を掛け合わせた場合は、3重クロス集計といいます。
「商品の満足度」と「使用頻度」の2つの設問だけでなく、多重クロス集計では、さらに「アフターサポートの利用回数」などを加えて分析します。
使用頻度の高さが満足度の高さと比例していた場合、さらにアフターサポートの利用回数を掛け合わせて集計してみると、アフターサポートの利用回数の多い層がより満足度が高い傾向がある、という示唆が得られることもあります。
このように多重クロス集計は、複数の変数が絡み合った関係を明らかにし、より深い気付きを得ることができる方法です。ただ、多重クロス集計は表が複雑になりがちなため、結果の解釈には注意が必要です。
クロス集計のメリット
調査結果が可視化でき、視覚的にわかりやすい
クロス集計の結果は表形式で表現されるため、データの傾向やパターンを一目で理解することが可能です。
たとえば、性別と好きな飲み物のクロス集計では、男性がどの程度コーヒーを好むか、女性がどの程度紅茶を好むかを一目で確認することが可能です。さらに、この表を基に棒グラフなどの視覚的な表現を作成することで、より直感的に理解しやすくなります。
このように、クロス集計は、大量のデータを短時間で解釈し、情報を簡潔に伝えることができるのがメリットです。
エクセルで簡単に集計が可能
クロス集計のもう一つのメリットは、Microsoft Excelなどの一般的な表計算ソフトウェアで簡単に集計できるという点です。Excelには、クロス集計を作成し分析するための「ピボットテーブル」機能があるため、コーディングや専門的な統計ソフトウェアの知識がなくてもクロス集計を行うことが可能です。
ピボットテーブルを用いると、特定の列を行や列のラベルとして使い、他の列のデータを集約できます。さらに、これらの集約されたデータに対して平均、合計、カウントなどの演算を適用することもできます。
Excelのピボットテーブルは直感的な操作性を備えているため、初心者でも短時間でクロス集計を作成し、データを視覚的に理解できます。
クロス集計のデメリット・注意点
ここからは、クロス集計のデメリット・注意点をお伝えします。
カテゴリーごとのサンプルサイズが一定数必要
クロス集計により、集計が細分化され、各カテゴリーの特徴が見えやすくなりますが、各カテゴリーに十分なサンプル数がないと、その有効性は大幅に低下します。カテゴリー毎のサンプルサイズが少なすぎると、その結果は偶然の産物であったり、誤差である可能性が高まり、統計的な有意性は低くなってしまいます。
一つの目安として、データ細分化したカテゴリー毎に30程あれば、統計学的に意味があると言えるため、サンプルサイズは最低でも30が集計できるように、調査設計・回答の回収を行う必要があります。
例えば、女性×10代、女性×20代、女性×30代、女性×40代、女性×50代と5つの年代でクロス集計したい場合はそれぞれの年代別に30サンプルは回収が必要ということです。
サンプルサイズが多ければ多いほど、クロス集計の精度は高まります。
そのため、クロス集計行う際は、各カテゴリーに十分なサンプルサイズが含まれることを確認することが重要です。サンプル数が不足している場合は、データ収集の方法を見直す、または別の分析手法を検討するなどの対策が求められます。
多重クロスをやりすぎない
複数の項目を掛け合わせて集計・分析するクロス集計は、クロスする項目が増えるたびに集計のサンプルサイズは減ってしまうため、統計的な精度は低くなってしまいます。
また、細分化することで課題となっているセグメントや項目を精緻に確認できることがメリットですが、細かくなりすぎると全体との整合性を見失ったり、集計表が細かくなりすぎて関係者の理解がついていけず説得しづらいなどのデメリットがあります。
多重クロスは3重までに留め、4重以上のクロス集計を多用することは控えることをおすすめします。
アンケート調査の調査設計から集計までトータルにサポートいたします。
クロス集計はデータ分析の基礎といえます。
集計自体は、エクセルを使えば誰でも簡単に可能ですが、どの属性や設問で掛け合わせるのか、どれくらいのサンプル数・サンプルサイズが確保できれば信頼できる調査結果といえるのか、といった点は調査の設計時に考える必要があります。
調査設計からアンケート集計までトータルサポートいたしますので、アンケート調査をお考えの場合は、電通マクロミルインサイトにご相談ください。
マーケティングリサーチのセミナーや自主調査企画も実施。