TOPサーバ構築・運用> リファラが絶対に必要
アクセスログ解析
アクセスログ解析でWebマーケティング効果を向上

第2回:ログに隠された数字の意味

著者:いなかどっとコム  石井 研二   2007/5/21
前のページ  1  2  3
リファラが絶対に必要

   ログに記録できる事柄は、これまで説明してきたことだけではありません。Apacheでは先の形式を「コモン(標準)」と呼びますが、もっと内容の詳しいものには「コンバインド(連結)」という形式があります。これはコモンログの後ろに「リファラ」「エージェント」の2つの項目を連結し、次のような記録となります。
000.000.000.000 - - [17/May/2007:00:03:11 +0900] "GET /index2.html HTTP/1.1" 200 1543 "http://www.yourdomain.com/index.html" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)"

   リファラ(参照元)とは元いたページのことで、クリックしてリクエストが発生した時にブラウザのアドレス欄に表示されていたURLです。上の例では「http://www.yourdomain.com/index.html」と、トップページを見たことを示しています。つまりこの人はトップページを見てからindex2.htmlへ移動したわけです。それが1行で記録されています。

   システム的に「クリックした時にアドレス欄に表示されてきたURLがサーバに飛んでくる」という仕組みは非常に便利なものです。例えばYahoo!で「ログ」という言葉で検索をすると、アドレス欄には下記のように表示されます。

http://search.yahoo.co.jp/search?p=%A5%ED%A5%B0&fr=top&tid=top&ei=
euc-jp

   上記のURLの中の「%A5%ED%A5%B0」という部分が、「ログ」というキーワードを符号化したものです。日本語のままではネット上を動かすことができないので、符号化されているのです。その結果をクリックしてどこかのサイトに訪れたとすると、そのサイトのページのログには下記のように記録が残されています。

000.000.000.000 - - [17/May/2007:00:03:11 +0900] "GET /index2.html HTTP/1.1" 200 1543 "http://search.yahoo.co.jp/search?p=%A5%ED%A5%B0&fr=top&tid=top&ei=euc-jp" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)"

   この仕組みのおかげで、Yahoo!のサーバで起こったはずの検索内容が私たちが運営しているサーバに飛んできてくれるのです。だから、このリファラを解析すれば、「Yahoo!で『ログ』というキーワードで検索した人が、紹介されていたindex2.htmlに飛んできた」ということを知ることができます。これはマーケティングにとっては非常に重要なものです。しかも、「fr=top&tid=top」の部分をみれば、検索結果の第1画面で紹介されていたということまでわかります。

   また次の部分が「エージェント」と呼ばれるもので、ここでは訪問者がWindows NT環境で、InternetExplorer6.0を使っていることを示しています。

Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)

   このコンバインドログは1行が長くなっています。Yahoo!の検索結果がリファラに残ったサンプルでは1行257バイトもあります。先のコモンログの1行84バイトのちょうど3倍です。できあがる1ヶ月のログデータ量も3倍になるのですから、元が1GBのデータなら3GBものデータになってしまうのです。コンバインドログが登場して、サーバ管理者はサーバに負荷を与える重いログを保存するのがますます嫌いになったともいわれているそうです。

   しかしWebを企業が活用するためには、このリファラを記録してユーザニーズを確認しなければなりません。そのために、アクセスログ解析の方法はいろいろと工夫されてきました。サーバに負荷をかけずに、有効な項目を集計分析するにはどうすれば良いか。次回からその方法を見ていくことにしましょう。

前のページ  1  2  3


有限会社いなかどっとコム 石井 研二
著者プロフィール
有限会社いなかどっとコム  石井 研二
有限会社いなかどっとコム 代表取締役
1961年、神戸市生まれ。大阪府立大学総合科学部(実験心理学)卒業。「DODA」編集デスク、「Salida」副編集長を経て、通販カタログ企画、社史編集、アウトドア雑誌企画等、多数。1995年からWebプロデューサ。当初からアクセス解析の手法を使って、さまざまな企業サイトの構築・運営を成功に導く。
1999年5月、有限会社いなかどっとコムを設立。ホームページ制作/コンサルティングとアクセス解析を行なう。2002年、アクセス解析サービス「サイトグラム」を開発・発売。年間10億ページビュー以上の解析を行い、多くの企業サイトにアドバイスを行なう「日本一のログ読み男」。2005年からは、新しい解析サービス「スコアメイク」を展開している。関西ソーホー・デジタルコンテンツ事業協同組合 理事


INDEX
第2回:ログに隠された数字の意味
  ログに記録されること
  画像の記録がログをこんなに重くする!
リファラが絶対に必要