clientIdやUser ID毎の生データはQuery Explorer 2で抜き出して、本当のユーザー単位の分析をしよう

カスタマイズ講座

投稿日:2014/9/16 作成者:衣袋 宏美

ユーザー行動をより正確に把握し、ユーザー理解をするために、匿名の個々人のデータを可視化するのがよい解決法です。その第一段階として、下記の記事では、clientId という個々のブラウザ(人ではなくて)の閲覧であることを紐付ける IDをカスタム ディメンションに入れてカスタム レポートで視覚化するという方法を紹介しました。
ユニバーサル アナリティクスでクライアント ID を表示して、個々人の行動分析をするには

そして第二段階として、User ID 情報もさらにカスタム ディメンションに入れてカスタム レポートで視覚化するという方法を紹介しました。
ブラウザを特定するclient ID と同一ユーザーを特定するUser ID を表示して、個人の行動分析をより正確に行うには

そして最終的には属性情報などをデータインポートしてGoogle アナリティクス内で個客分析をして施策にフィードバックする方法にもっていこうと考えていたのですが、そもそもGoogle アナリティクスの箱の中ではそれに相応しいデータの持ち方がしにくいということで、方針変更しました。

何故なら個々の人の閲覧履歴データを上手に扱うには、生データに近い個々のデータの形にしないといけないのですが、Google アナリティクスの箱ではまとめた集計データとしてレポートするしかないので、そこが不都合な訳です。

実際個客それぞれの行動を理解するには、誰(User ID)がどのブラウザ(Client ID)で、どのデバイスから、いつ(アクセス日時)、どのチャネルから(参照元やメディアなど)、何度目の訪問(累計のセッション回数)を行い、どのページ(閲覧ページ)を見たかといった必要な情報全てを一つ一つのレコードで表現して抜き出す必要があります。

最低でも図1くらいの分析軸となるディメンションの列が並んでいないと、個々の利用実態を深く理解していくのは困難です。しかしGoogle アナリティクスはカスタム レポートでも二つのディメンションを表示するのが限界です。

 

図1:生データ例

図1:生データ例

 

分析元としてまとめたい生データのゴールは、図2のようなCRMデータもUser IDなどをキーにして結合した図3のようなものになります。

図2のCRMデータは実際はもっと細かい属性情報や購入に関する情報を用意するとよいとは思いますが、簡単なものとして例示しました。RFMレベルと書いた列は、直近購入日(recency)、購入頻度(frequency)、累積購買額(monetary)それぞれのランクを5分類した場合のステージを各桁で表したものです。

 

図2:結合したいCRMデータ

図2:結合したいCRMデータ

図3:結合したデータ

図3:結合したデータ

 

このようなデータ連携をGoogle アナリティクスの箱の中でやらない方がよさそうだというのは当然です。そこで現実的には、Google アナリティクスが用意しているAPIを使って、データを一気に抜きだすのがよいというのが結論です。APIでは最大7つのディメンションを同時に抜き出せます。

図4はGoogle Analytics Query Explorer 2というツールで実際にデータを出力したものです。このツールはブラウザ上でログインした上で、Google アナリティクスのデータをAPIの仕様で簡単に抜き出せます。

 

図4:Google Analytics Query Explorer 2での出力例

図4:Google Analytics Query Explorer 2での出力例

 

一行目(図4赤枠部分)がディメンションと指標名になります。図4の例では左から、カスタム ディメンションの一番(ここではclientIDになります)、セッション回数、閲覧ページ、閲覧時間、閲覧分、参照元/メディア、ページビュー数を並べてあります。

図4と図5は同じデータから抜き出しましたが、行数に違いがでています。User IDの値を入力したカスタム ディメンションの2番目も抜き出した例が図5ですが、User IDの値がないデータは除かれてしまうからです。clientIDとUser IDの紐付けは別途保持しておき、図4のような全データを出力し、後でUser IDを紐付けるのがよいと思います。

 

図5:Google Analytics Query Explorer 2での出力例

図5:Google Analytics Query Explorer 2での出力例

 

最終的には、これらのデータからユーザーをクラスタリングするなどグループングして、メールマガジンの内容を別にして送るなどの施策にフィードバックすることが理論上はできそうだということがわかりました。

しかし実際にやってみると大変手間が掛かります。一定以上の効果が見込めるのであれば、やはりGoogle アナリティクス プレミアムやBig Query、施策にフィードバックできるツールなどと連携して、ある程度自動的にデータを施策に返すような仕組みの導入をお薦めしたいと思います。やはり手動DMPなんてのは無理ですね。

 

お知らせ