Googleスプレッドシートの正規表現を使ったURLの整理

レポートのカスタマイズ

投稿日:2012/4/24 作成者:吉田 喜彦

ASPやCMSを使っていますと、とにかくURLにパラメータがたくさん付きますよね。GAのカスタムフィルタでも実は意外と面倒なのが、URLの整理です。今回は、Googleスプレッドシートの正規表現関数を使ってURLを整理してみたいと思います。



Googleドキュメント・スプレッドシートの正規表現関数

公式ヘルプはこちらです。
Google スプレッドシートの関数リスト – Google ドキュメント ヘルプ

そもそも、何でEXCELじゃないの?と思われる方もいらっしゃるかと思いますが、実はEXCELは標準では正規表現が使えないんです。アドオンで利用可能になるらしいですが、まあGoogleドキュメントは手軽なのでこちらで進めます。

正規表現の関数には、以下の3つがあります。

=RegExExtract(文字列, 正規表現) >>抽出
=RegExMatch(文字列, 正規表現) >>マッチ判定
=RegExReplace(文字列, 正規表現, 置換) >>置換



正規表現関数を使ったURL置換の実際

以下のように、Googleスプレッドシートに設定します。
Googleスプレッドシートの正規表現

A1のパラメータ付URLにあります「sale」をマッチさせてみると、ちゃんとマッチします。
Googleスプレッドシートの正規表現

一方「sele」と敢えて綴りを間違えてみますと、マッチしませんので、if関数の偽の処理がされます。
Googleスプレッドシートの正規表現


正規表現っぽく使ってみる

たとえば、「qcode=」と3桁の数値を含む正規表現にしてみます。マッチしましたね。
Googleスプレッドシートの正規表現

()をつけてキャプチャしてみます。()のところだけが抽出されました。
Googleスプレッドシートの正規表現

あとは何回かにわけて抽出や置換をすればOKです。qcodeの番号をディレクトリにすることが出来ました。
Googleのスプレッドシートの正規表現

Googleアナリティクスのフィルターにおける正規表現が癖があり、かつ、スグに結果がわからないので使い辛いかもしれませんが、こちらであればすぐに結果がわかるので、いろいろと試せるかと思います。
 

 

執筆者:吉田 喜彦

アクセス解析漫画家。解析結果をもとにオチを変えていく論理派。国内で初のGoogleアナリティクスAppギャラリー掲載歴を持ち、Googleアナリティクスでは、スクリプト、APIネタを得意とする。ブログはhttp://www.kagua.biz

お知らせ