web関係のお仕事やwebサイトを運営してる方ならご存知だと思うのですがウェブマスターツールというGoogleの提供する無料ツールがあります。
最近Google Search Consoleという名前に変わりました。
Google Search Consoleを使っていていつも疑問に思っていたことがあったので今回はそれを追及してみます。
今回のテーマは
インデックスステータスの「インデックスに登録されたページ」とサイトマップの「インデックスに登録済み」の数値に差が出てる事が多々あるのですがこの違いは何なの!!!
です。
皆さん気になったことないですか?例えば「インデックスに登録されたページ」は80なのに「インデックスに登録済み」は70になっている。そんな現象が起こるのは何故なのか少し調査してみました。
※今回は似たような名前が多くてわかりにくいので青と赤で色分けしています。
目次
インデックスステータスとサイトマップ
Google Search Consoleにログインすると左側にメニューが表示されます。
「Googleインデックス>インデックスステータス」
これはGoogleがクローラーや送信されたサイトマップから拾ってきたデータのうち、何件がGoogleのデータベースにインデックスされているかを表しています。
「クロール>サイトマップ」
これは送信されたサイトマップの中から、何件がGoogleのデータベースにインデックスされているかを表しています。
2つの機能の概要はこんな感じです。では何故
「Googleインデックス>インデックスステータス>インデックスに登録されたページ」
「クロール>サイトマップ>インデックスに登録済み」
上記2つの項目に誤差が生まれるのでしょうか?
いくつか原因があるみたいなので、個別に追いかけてみましょう。
インデックスステータス機能とサイトマップ機能での反映時間の違い
「Googleインデックス>インデックスステータス>インデックスに登録されたページ」の方は反映までに2週間ほどかかったりするようです。正確な期間は公式に発表されているわけではないようですが、だいたい長ければ2週間くらいのようです。
それに対し、「クロール>サイトマップ>インデックスに登録済み」の方は処理された時に反映するようなので、こちらの方が先に表示される事になります。
つまり出来立てのサイトであれば、
「Googleインデックス>インデックスステータス>インデックスに登録されたページ」→0件
「クロール>サイトマップ>インデックスに登録済み」→8件
等という状況になってしまう事があるわけです。
インデックスステータス機能とサイトマップ機能での仕組みの違い
インデックスステータスの方はクロール等のサイトマップ以外の情報からの分も含めてインデックスされた数が表示されます。
サイトマップの方は、サイトマップの情報の中からインデックスされた数が表示されます。
つまり外部からリンクされている時など、sitemap.xmlから漏れてしまっているページ等もインデックスステータスの方は拾っているけど、サイトマップの方はsitemap.xmlの内容しか拾っていないよ、という事ですね。
上記の2つの原因が絡みあって
仮に毎日ページが増え続けているサイトがあったとして
「”反映時間の違い”によりサイトマップ側の方が多い数値が出る。」
「”仕組みの違い”によりインデックスステータス側の方が多い数値が出る。」
という状況が生まれ、常にどっちかが多いというわけではなく、タイミングによってサイトマップ側が多い時もあればインデックスステータス側が多い場合も生まれているようです。
まとめ
Googleのインデックスはサイト運営者にとってとても重要な意味を持ちます。モチベーションに繋がったり、商用サイトなら売上に繋がったり。だからしっかりと意味を理解して、出来るだけ自分の管理するサイトの状況を理解してあげることで、価値のあるサイトを目指していきたいと思います。