« [2005年を振り返る・その1] その後の Musical Baton | トップページ | [2005年を振り返る・その2] セキュリティ関連の騒動 »
2005.12.26
Yahoo! 経由のアクセスが激減 - 原因の分析と対策
なぜ、12月15日付けのインデックス更新以降、この blog のアクセスが急減したか。その原因を探るには、まず、Yahoo! に当 blog (Webページ) がどういう風に評価されているか、を知る必要があります。
幸いなことに、先日、Yahoo! Japan の Web Serach API が公開されました。この API を使うと、特定のドメイン(最大30個まで指定可能)に対象を絞った検索を実行し、その結果を XML で受け取ることができます。
この XML ファイルには、以下のような内容が格納されています。
- Web ページの title
- Web ページの要約 (summary)
- Web ページの URL
- Web ページの URL (Yahoo! の用意したリダイレクタ経由)
- Web ページの最終更新日時(もしくは、Yahoo! のクローラーの最終訪問日時)
- 当該 URL の実体のMIMEタイプ
- 当該 Web ページのキャッシュとそのサイズ
ここで注目すべきなのは、「Web ページの要約 (summary)」です。ここに何が格納されているかを調べることが、検索結果を評価する上での肝になります。
実験
試しに、以下のような form を作って、検索結果(XML)を取得してみました。
- 観測気球、観測気球フリーを対象に検索を実行
- 全Webページを対象に検索を実行
上記の form を使って、「コミックカードガム」というキーワードで「観測気球、観測気球フリーを対象に検索を実行」してみたところ、返ってきた「Web ページの title」、「Web ページの要約 (summary)」、「Web ページの URL」は、以下のようなものでした。
<Title>[観] Bloglines の去就</Title> <Summary>収集物の記録書庫 a data archive of collection -- collectible toys 2005.02.08 Bloglines の去就 ... " ドラえもんコミックカードガム | トップページ | 「輝く! 日本ブログ大賞 2005」に応募してみるテスト(BlogPet) " ...</Summary> <Url>http://watcher.moe-nifty.com/memo/2005/02/bloglines_.html</Url>
「ドラえもんコミックカードガム」という記事があるにも関わらず、そちらにはヒットせず、全く別の記事「Bloglines の去就」がヒットするという意外な結果になりました。
<Summary> の中身をよく読むと、
ドラえもんコミックカードガム | トップページ | 「輝く! 日本ブログ大賞 2005」に応募してみるテスト(BlogPet)
という部分がヒットしたことが分かります。この文字列は、ナビゲーション用のリンクで、各個別記事の上の方に設置してあります。当該記事の1つ前の記事、トップページ、当該記事の1つ次の記事へのリンクを並べたものです。
つまり、本来ヒットして欲しい記事ではなく、1つ隣の記事がヒットしてしまったことになります。
以上の結果から、Yahoo! が Web ページを評価するとき、まず、body 部の先頭から順番に見ていき、最初の方にある文字列、文章ほど高いポイントを与えているのではないか、という仮説を立てました。以前は、Yahoo! の Web ページ評価アルゴリズムは、head 部にある
<meta name="descriptions" content="当該 Web ページの要約" />
で示される「当該 Web ページの要約」の内容を最初に拾ってくれていたと思われます(各種状況証拠より推定)が、今回のインデックス更新では、もはや、この meta name="descriptions" を拾ってくれなくなったのかもしれません。
ということで、body 部のできるだけ最初の方に、当該 Web ページの内容を端的に表す文章(要約、キャッチフレーズ)やキーワードを載せることで、意図しない Web ページがヒットしてしまう可能性を減らせるかもしれません。さらに、あわよくば、何らかの SEO 効果も期待できるかもしれません。
とはいっても、ナビゲーションが Web ページの上の方にあるのは、ユーザビリティの観点から推奨される(場合がある)と思うし、それなりに自然だとも思うわけです。いずれは、検索エンジンの評価アルゴリズムが進化し、ナビゲーション部分は無視、あるいは低いポイントを与えるなど、誤爆の可能性を減らす方向に行くものと期待していますが、当面は、Web ページを作る側で何らかの工夫をして、人間にも検索エンジンにも優しい Web ページを書くように心がけた方がよいのかもしれませんね。
では、具体的にどんな構造の Web ページにすればいいのでしょうか。
試験的に、この「観測気球」の個別記事のページを以下のような構造にしてみました。実際に効果があるかどうかは、「次」か「次の次」の Yahoo! のインデックス更新で判明するはずです。
- 変更前
- ブログのタイトル
- ブログのサブタイトル
- ナビゲーション
- 記事本体
- 変更後
- ブログのタイトル
- ブログのサブタイトル
- 当該記事の件名、要旨、キーワード
- ナビゲーション
- 記事本体
果たして、どういう結果が出るでしょうか。何ヶ月か後に、結果を報告したいと思います。
投稿者: tsupo 2005.12.26 午後 02:47
| 固定リンク
|
|
| ![]()
|
|
アマゾンわくわく探検隊
トラックバック
この記事のトラックバックURL:
この記事へのトラックバック一覧です: Yahoo! 経由のアクセスが激減 - 原因の分析と対策:
» Yahoo! 経由のアクセスが激減 - その後 from 観測気球
結論から先にいうと、先日実施した対策は Yahoo! には効果なし。でも、Google に対しては絶大な効果があり、結局、アクセス数は増えました。 続きを読む



