企業がアンケートを取る際には「どれだけローデータを活用できるか」という点が、アンケートの結果や顧客の生の声を反映できるかどうかを左右します。 データは加工と集計を行って、どれだけ活用できるかが重要です。 こ […]
企業がアンケートを取る際には「どれだけローデータを活用できるか」という点が、アンケートの結果や顧客の生の声を反映できるかどうかを左右します。
データは加工と集計を行って、どれだけ活用できるかが重要です。
この記事ではローデータの集計方法や格好や処理する際のポイントについて解説していきます。
アンケートの結果を経営に役立たせたい方はぜひ最後までご覧ください。
ローデータの意味とは
ローデータとは、アンケート結果をそのままエクセルなどに落とした生のデータ
です。
ローデータのままでは「どんな意見がどの程度の量があるのか」ということを把握できないので、ローデータは集計することが重要です。
まずはローデータの概要やレイアウトデータとの違いや集計方法について詳しく解説していきます。
手付かずの生データ
ローデータとはアンケートや調査の結果を表した手付かずの生データです。
ちなみにローデータの「ロー」とは「生」という意味です。
Q1 | Q2 | Q3 | Q4 |
1 | 2 | 5 | 2 |
2 | 2 | 1 | 3 |
1 | 4 | 1 | 1 |
調査した人の回答が1人につき1行ずつ記載されているだけですので、ローデータだけを見ても何の調査や回答かは把握できません。
上記のローデータのサンプルのように、1番上の行にはアンケート番号、各行はアンケート番号ずつ、それぞれの回答者の回答が並んでいるだけですので、これだけを見てもなんのことかは分かりません。
ローデータを読み解くためには、レイアウトデータと合わせて解析する必要があります。
ローデータの解析に必要なレイアウトデータとは
ローデータの解析にはレイアウトデータが必要不可欠です。
レイアウトデータとは、それぞれのアンケートの設問と回答を一覧にしたものです。
Q1 | 性別を教えてください |
1 | 男性 |
2 | 女性 |
Q2 | 年齢を教えてください |
1 | 20代以下 |
2 | 30代 |
3 | 40代 |
4 | 50代 |
Q3 | お住まいの地域を教えてください |
1 | 北海道・東北 |
2 | 関東 |
3 | 中部 |
4 | 関西 |
5 | 中国・四国 |
6 | 九州・沖縄 |
Q4 | 毎月の通信料はいくらですか? |
1 | 3,000円以下 |
2 | 5,000円以下 |
3 | 1万円以下 |
4 | 1万円以上 |
このように、レイアウトデータは設問番号と、選択肢に対応した質問と回答が一覧にされています。
ローデータとレイアウトデータを合わせて見ると、「中国・四国地域に住んでいる30代の男性の毎月の通信費は3,000円超5,000円以下」ということが分かります。
ローデータを記録・集計する方法
ローデータを記録し、集計する方法は主にエクセルを使用する方法と集計ツールを使用する方法に分かれます。
それぞれのメリットとデメリットは次の通りです。
エクセル | 集計ツール | |
メリット | 複雑な集計が簡単にできる | グラフ作成が簡単 |
デメリット | グラフにするのが面倒 | お金がかかることが多い |
エクセルにはピボットテーブルという機能があります。
ピポットテーブルとはテーブル上にあるデータをさまざまな切り口で分析する Excelの機能です。簡単なメニューに従ってデータを選ぶだけで、きれいな集計表やグラフを作ることができます。(参考:Microsoft)
ピポットテーブルを使用すれば集計は簡単にできますが、エクセルはグラフにする作業が少々面倒です。
一方、集計ツールを使用すれば、集計作業はクリック1つでGT集計やクロス集計などを簡単に行うことができ、ビジネスに必要だと思われるようなグラフ作成も簡単です。
しかし、集計ツールは有料になっているものが多く、コスト的にはエクセルよりも高くなってしまいます。
最初はエクセルで集計し、「時間がかかる」「面倒」だと感じた場合には、集計ツールに切り替えると良いかもしれません。
ローデータとRAWDataは別物の用語
RAWDataと言った時には主にwebやコンピューターの世界で使われるデータで、「ローデータ」はアンケート結果の「生のデータ」という使い分けをされていることが一般的です。
ネットでローデータについて調べようと「ローデータ」と検索するとRAWDataについて表示されることがあります。
読み方は同じですが、ローデータとRAWDataでは意味は同じですが、ニュアンスが少し異なるので注意してください。
RAWDataとは日本語に訳せば「生のデータ」です。
しかし英語表記する場合には、Webやコンピューター上での「生のデータ」を指すのが一般的です。
平均値や度数、パーセントなどに加工されていない生のデータのこと。生データとも言う。
参考:統計用語集
単に「加工されていないデータ」を示しているだけで、アンケートの回答について表しているわけではありません。
ローデータを加工や処理する際のポイント
ローデータを加工・処理する際には次の3つのポイントを抑えることが重要です。
- 1つのサンプルのデータは一行で整理する
- 単位と表記を統一する
- 半角英数字のみ使用する
集計方法や表記などを統一することによって、ローデータの加工や処理は非常に簡単になり、逆にここが統一されていないと、単なる集計も非常に煩雑なものになってしまいます。
ローデータを加工、集計する際の3つのポイントについて詳しく解説していきます。
1つのサンプルのデータは一行で整理する
1人の回答者の回答は1行で整理しましょう。
Q1 | Q2 | Q3 | Q4 | |
回答者A | 1 | 2 | 5 | 2 |
回答者B | 2 | 2 | 1 | 3 |
回答者C | 1 | 4 | 1 | 1 |
このように、回答者ごとに1行で整理することによって、サンプルごとの回答結果が非常に分かりやすく、回答内容を間違えて集計してしまうこともありません。
同じ列か同じ行を使用して、簡単に集計できるようにしてください。
単位と表記を統一する
回答は単位と表記を統一するようにしてください。
例えば、10%と0.1などと単位が異なってしまうと、集計する際に、10.1%と誤ってしまうことがあります。
10%と0.1は同じですので、集計する際には20%が正しいはずですが、単位が異なることによって誤った集計になってしまいます。
また、「10%」という意味の回答をしてもらうのに、10なのか10%なのか0.1なのかという表記を統一しておかないと、正しく集計できません。
集計を正しく行うために、単位と表記は統一するようにしてください。
半角英数字のみ使用する
回答は半角英数字のみ使用してください。
エクセルなどは、半角の「1」と全角の「1」は異なるデータとして扱われてしまいます。
WEBに慣れていない回答者などは全角を使用して回答することも多く、回答者側もわざわざ全角を半角にするなどの手間がかかってしまい、アンケートの回答を満足に得られない可能性もあります。
数字で回答させる場合には、選択肢を設けて選択してもらうようにするなど、回答方法も間違いがないように工夫する必要があるでしょう。
ローデータを分析する方法を解説
ローデータを分析する方法は主に次の4つです。
- 単純集計
- クロス集計
- 基本統計量を求める
- 統計解析
それぞれ、どのような集計方法なのか、詳しく見ていきましょう。
単純集計する
単純集計とは各質問項目の回答を単純に集計することです。
男性が何人、女性が何人、関東地方の人が何人、関西地方の人が何人のように、ローデータを単純に集計して数や割合などを求めます。
クロス集計する
クロス集計とは複数の設問を掛け合わせて集計することです。
例えば「Q1:性別」「Q2:当社商品にはどの程度満足していますか?」という設問を掛け合わせると「男性は満足している人の割合が多かったが、女性には満足度が低くなった」という結果を知ることができます。
これによって、よりターゲットを絞った商品やサービスの改善策を策定することが可能です。
基本統計量を求める
基本統計量とは、ローデータの平均値や中央値のことです。
中央値や平均値が分からないと、データが表しているものがよいものなのか、悪いものなのかを知ることはできません。
「毎月いくらお金を使うか」などの量的なデータを集計する際には、基本統計量を求めた方が良いでしょう。
統計解析を行う
統計解析とは、多くのデータを収集・探索・分析して、データに含まれるパターンや傾向を明らかにする科学です。
簡単にできる方法ではないので、最も難易度の高いデータ分析方法にはなりますが、統計解析を駆使できるようになれば単純集計やクロス集計では分からないような情報や傾向をつかむことができます。
ローデータの活用事例3選
ローデータは実際どのように活用されているのでしょうか?
次の3つの業界ではローデータを活用して業務の効率化や改善に役立たせています。
- 製造業
- 防災・危機管理
- 小売業
ローデータを活用している3つの業界の活用事例をご紹介していきます。
製造業
製造業ではセンサーのデータを可視化することによって、工場全体やラインごとの設備の稼働状況や胡椒の多い箇所を知ることができます。
また、製造ミスが多いラインはどこかなども把握できるので、データ活用によって、より効率的に運営できる工場を作ることが可能になります。
防災・危機管理
防災や危機管理で活用されるデータは画像データです。
災害時の画像データから危機が発生する場所の予測などをすることができます。
人工衛星によって災害が発生した箇所がどこかを調べ、さらにドローンで詳細な情報を集め、災害が発生する前の画像と比較することによって、どのような場所で災害が発生しやすいのかを把握することができます。
災害対策においては、データから読み取れる、災害発生可能性が高い場所のみを補強すればよいため、効率的な防災対策を行うことができるようになりました。
小売業
小売業では顧客の年齢、購入金額、購入商品などを細かく分析することによって、どの層の顧客がどんな商品をいくら購入するのかを知ることができます。
これによってターゲットを絞って、最も購入させたい層にアプローチできる様々な販売戦略を策定することが可能です。
まとめ
ローデータとは何も加工がされていない生のデータです。
「顧客の声を聞く」ことを重視するあまり、アンケートなどを取ることが最も重要なことのように感じる人は多いですが、ローデータだけでは何も分かりません。
大切なことは、与えられたデータを加工して、結果を分析することです。
分析が円滑に進むよう、表記や単位などは統一するなど、形式上の注意点を把握しておきましょう。