グーグルサイトマップで送信したURLがほぼ登録されていることをウェブマスターツールのグラフで見ることができる

この記事は約3分で読めます。

Sitemapweb
グーグルはアナリティクスとウェブマスターツールの改良が進んでいて、グーグルウェブマスターツールは視覚的にも見やすくなってきている。とくにグーグルサイトマップがグラフで視覚化して見えるのがよい。サイトマップで送信したURLがほぼ登録されていることをグラフで見ることができる。サイトマップは「sitemap.xml」という名称で作成するのが標準であるが、RSSである「index.rdf」や「atomu.xml」をサイトマップとして代用することもできる。複数のサイトマップ登録も可能なので、抜け漏れを減らす意味でこれらすべてを登録してもよい。

このブログでは3つのサイトマップを登録している。

サイトマップ名 送信URL数 登録URL数
atom.xml       8       2
index.rdf       8       3
sitemap.xml  2662    2660

形式的にはグーグル標準のxml形式で作成した「sitemap.xml」が効率良く登録されているようである。

サイトマップとは、WEBサイトのページの情報をGoogleに提供する手段で、自分のホームページの全ページのリストを特定の形式で一覧表示にしたページのこと。サイトマップを作成して送信すると、Googleの通常のクロール処理では検出できない可能性のあるURLを含むサイト上のすべてのページをGoogleに知らせることができる。

サイトマップの形式は年々柔軟になっており、テキストファイルやRSS/Atomフィード(RSSデータ)でもサイトマップとして送信することができる。ただし、原則として「サイトマッププロトコル」に準じたxml形式のほうがよい。

▼「sitemap.xml」の例
<urlset>
<url>
<loc>/</loc>
<priority>1.0</priority>
</url>
<url>
<loc>/access/index.html</loc>
</url>
<url>
<loc>/analytics/index.html</loc>
</url>
<url>
<loc>/2004/03/blog.html</loc>
<lastmod>2004-03-20T13:44:31Z</lastmod>
<changefreq>daily</changefreq>
</url>
</urlset>

また、テキストファイルのサイトマップを作成する場合は、以下の点に注意が必要である。
Googleは指定された URL をそのままクロールするため、完全な形でURLを記述すること
テキストファイルは UTF-8 エンコードで作成すること
テキストファイルにはURL以外を記述しないこと
テキストファイルの名前は自由だが、ファイルの拡張子は必ず「.txt」にすること
→「sitemap.txt」とするのが無難である

なお、このブログのサイトマップは「/sitemap.xml」である。