マーケティングの関心がビッグデータに集まる昨今、事業会社やメーカーは消費者の購買行動に関わるデータを集め、手軽にデータを保有する時代となりました。一方で保有はしてみたものの、手元にあるデータの扱い方や分析方法がわからないといった活用に関してのご相談をいただく機会が増えてきました。

そこで、マーケティング担当者が押さえておくべき定量分析の心得と、グラフを使った相関関係を読み解くHow toをご紹介します。

そこにデータがあった時、どう扱えばいいか?

例えば、「Webメディア記事のSNSシェア数を伸ばしたい」というのは、自社でWebメディアを運営されているマーケッターの方であれば、誰もが考えたことのあるテーマだと思います。(メディア運営をされていない方も、ご自身の業務に引き寄せて考えてみてください。)

あなたは、アクセスログをダウンロードし、ローデータを眺めているとしましょう。
そして「シェア数と最も関係が深いデータは何だろうか?おそらくPV数だろうなぁ。」と考えたとします。

このあと、あなたならローデータをどう扱いますか?

目は最強の分析ツールってどういうこと?

はじめに、定量分析の心得をご紹介します。
上のローデータと下のグラフを比較したとき、どちらが意味合いを理解しやすいですか?多くの方が「グラフ」と答えるはずです。ビジュアル化してあげることで、ローデータでは気づけないデータが持つ意味合いを発見できるという観点から「目は最強の分析ツール」と言っています。

加えて、データ分析の結果を第三者にプレゼンテーションする場をイメージしてみましょう。ローデータでは受け手が意味合いを理解するのに苦しみ、プレゼンテーターの伝えたい意図が伝わりにくくなってしまいます。データはビジュアル化して伝えることを心がけましょう。

相関関係を知りたいときに使うグラフは?

散布図がおすすめです。Excelなどの表計算ソフトでグラフの散布図を選択しましょう。その際、Y軸に結果系(シェア数)、X軸に原因系(PV数)を取ります。YとXに入れるデータはルールで決まっているので結果系と原因系を逆にしないように気をつけましょう。
たったそれだけで、散布図は完成です。

散布図が完成したら近似曲線を追加しましょう。上の図で言うところの真ん中の点線です。表計算ソフトの機能で、グラフ要素追加のオプションにあると思います。加えて、オプションから数式とR^2のチェックボックスにチェックを入れましょう。
今回ご紹介している近似曲線は、中学生の頃に勉強した一次関数です。

公式:Y=aX+b

R^2(Rの二乗)ってなに?

一次関数の計算式の下に R^2=0.6669 という記載がありますね。
これは決定係数と言います。R=相関係数なので、相関係数の二乗が決定係数です。
決定係数とは、Yに対するXの説明力を示しています。今回の例でもう少し詳しく言うと、「PV数でシェア数の何%が説明できるか?」という意味になります。
この例の結論は「シェア数の66%はPV数で説明がつく」と言っていることになります。

別の角度からこの事例を見てみると、残りの34%はPV数以外の因子がシェア数に影響していることになります。文字数や写真数、その他にも定量化されていない様々な可能性が考えられますね。

近似曲線を軸に全体を見てみよう!

  • 近似曲線より上にある点は優秀です
  • 近似曲線より下にある点はあまり優秀ではありません

今回の例で言えば Y=0.0389X+43.81 の計算式に則り、XにPV数を代入すればシェア数になるはずです。
近似曲線より上にあるグループはPV数以外の要因がプラスに働いていると言えます。
一方で、近似曲線より下のグループはPV数以外の要因がマイナスに働いていると言えます。

それで、どうする?

目は最強の分析ツールですから、まずは手元にあるデータを表からグラフに変換してみましょう。改善のヒントが見つかるかもしれません。そして、データ分析のプレゼンテーションをする際は「シェア数はPV数と関係が深い気がします。」ではなく、「シェア数のxx%はPV数で説明がつきます。」と言えたら素晴らしいですね。

Goodpatchでは、今回ご紹介したような定量分析から導かれる仮説を元に、素早くプロトタイピングしユーザーテストによって検証するようなデザインスプリントを実施しています。よろしければ併せてご覧ください。