データの見方・読み方を学ぼう!
どの検索会社のツールを参照すればいいの?
よく耳にする疑問として、「インデックス数や被リンク数はどの情報を信用すればいいの?」と「ウェブマスター向けツールと、通常の検索サイトで得られる情報(site:、link:など)とどちらが信用できるの?」の2つがあります。
まずインデックス数について解説しましょう。この数字を読み解くためには、自分のサイトのページ数(URL数)を把握する必要があります。静的にWebページを1つずつ作成・公開しているサイトであれば、ある程度のページ数を把握できるでしょう。動的にページを生成している場合も、おおよそのページ総数をはじき出せるはずです。
この存在しうるページの数(実数)を把握したら、各社のツールが表示するインデックス数を確認しましょう。
ところで、どの会社のツールを参考にすればいいでしょうか。それは、自分がターゲットとしている検索エンジンのツールです。各社それぞれのクローラ性能が異なるために、検索エンジンによって認識されるページ数は異なりますので、対象外の検索エンジンの数字は参考にしなくて結構です。
さて、両者の数字を比較してみましょう。先述した通り、クローラの性能は十分でないこと、またサイト内部のページやリンク構成によって、クロールから漏れているページが存在するので、両者の数字は乖離(かいり)するはずです。
この時、実数よりもツールが表示する数字が少ない時は、その数の分だけ登録されていないページが存在するということです。特に中規模~大規模サイトの場合、クロール漏れのページが多数存在することはよくあることで、問題はそのページの重要度の度合いです。
比較的よく閲覧される商品詳細ページや商品ブランドのカテゴリがインデックスされていない場合は、トラフィックを損失していることになりますから、対策を練りましょう。サイトのカテゴリ間、ページ間のクロスリンクの密度を高めたり、本連載で触れているサイトマップを使うなどして、きちんと奥深いところにあるページも巡回・登録されるような工夫をしましょう。
逆に、ツールが表示するインデックス数が実数よりも多い場合は、不必要な、あるいは意図しないURLがクロールされている可能性があることを表しています。例えば、PC版サイトなのにモバイル版サイトがインデックスされている、ほかのネット広告などで利用した解析用パラメータを持つURLが登録されている、過去に公開していた、今は不要のページが登録されているといった場合が考えられます。
インデックスされていても問題がないURLならいいですが、それが原因でサーバーに負荷がかかっている場合もありますので、検索エンジンに登録させる必要がないものはrobots.txtでnoindex(登録しない)を指定するなどして、回避するといいでしょう。
結局、Web検索とツール、どっちのデータを見ればいいの?
インデックス数は、各社のウェブマスター向けツールにログインしなくても、検索窓でsite:(ドメイン名)を指定すれば参照できます。では、この検索式による数字とツールによる数字、どちらを参考にすればいいでしょうか。
答えはズバリ、管理ツールで提供される数字です。理由は、各社ともにウェブマスター向けツールでは、より詳細なデータを参照可能にしているからです。実際に、3社ともツールを見ることを推奨しています。
ツールを利用する場合は、連載1~3回目で触れた「サイト認証」を行って、サイトオーナーであることを証明しているため、検索エンジン側もサイトオーナーに有益な情報として、より詳細なデータを公開してくれているわけです。GoogleではiGoogleから概要を参照できるガジェットを無料で配布しています。
話をまとめますと、「きちんとした数字をみたいなら、ウェブマスター向けツールのデータを参照する、どのツールを使うかは、どの検索エンジンでの掲載状況を監視したいかで決める」ということです。
なお、ウェブマスター向けツールの方が詳細なデータが提供されるといっても、それでも全部ではありません。インデックス数はおおよそアテにできるのですが、被リンク数とその具体的なURLは、各社ともにツールの方が詳細ですが、やはり完全ではありません。