サンプリングの機能が二択に変わった

共通の機能解説

投稿日:2014/6/10 作成者:衣袋 宏美

2014年5月頃にサンプリング機能が若干変わったようです(追記:アカウントによるようです)。以前はQRコードのような表示部分(図1赤枠部分)をクリックすると、スライドバーが現れ(図1青枠部分)て、そこで処理速度とデータの精度を調整するようになっていました。

 

図1:サンプリング機能(旧)

図1:サンプリング機能(旧)

 

これが図2のようにプルダウンの二択から選ぶような方式(図2赤枠部分)に変わったようです。デフォルトでは「応答は遅いものの精度に優れる」が選択されています。そしてその左側には現在表示している集計が何回のセッションのデータを基に作成されているのかが示されています(図2青枠部分)。

 

図2:サンプリング機能

図2:サンプリング機能

 

図2はユーザー サマリーのレポートで、3か月分のデータを足しあげた集計が基本となるため、50万を超えるセッションが対象ですが、その全数(100%)が集計対象となっていると示されて(図2緑枠部分)います。かなり長期間を対象にしても、「すべてのトラフィック」や「すべてのページ」などの基本的なレポートは、百万セッションを超えても100%が対象になるようです。

ここで例えば「マルチ セッション ユーザー」というセグメントを加えて(図3赤枠部分)みたのが図3です。集計対象になったのは、全体の74%の491,044セッション(図3青枠部分)となり、サンプリングされました。

 

図3:データの精度を優先

図3:データの精度を優先

 

ここで処理速度を優先して(図4赤枠部分)みたのが、図4です。集計対象になったのは、全体の36.7%の243,366セッション(図4青枠部分)となり、集計対象セッション数は少なくなりました。

 

図4:処理速度を優先

図4:処理速度を優先

 

このサンプリングの仕様に関しては、下記公式ヘルプに記述があります。
Google アナリティクスでのサンプリングの仕組み

簡単に言えば、プロパティレベルで50万を超えるセッションが対象になった集計は、自動的にサンプリングされるという仕組みです(レポートの種類によって例外があります)。対象はフィルタを適用したビューのレベルではないです。

サンプリングされると、デフォルトで25万セッションがサンプリングされ、そこからフィルタやセグメントされたデータに絞り込まれるとヘルプには記述されているのですが、デフォルトは図3のように「応答は遅いものの精度に優れる」が選択されていて、上限の50万ぎりぎりまでサンプリングし、「応答は早いものの精度に劣る」を選択すると、図4のように25万セッションでサンプリングされるようです。

サンプリングされてしまうと、数の少ないコンバージョン数などの指標で大きくぶれる可能性が高くなります。そういった場合にサンプリングの網にかからないようにするためには、面倒ですが、50万セッション以内になるように集計期間を短くして100%の集計を行った上で、足し合わせるなどしましょう。

 

お知らせ