Yahoo! 経由のアクセスが激減 - 原因の分析と対策

観測気球

収集物の記録書庫 a data archive of collection -- collectible toys

[要旨] 12月15日のインデックス更新で何が変わったのか、Yahoo! の Web Search API による検索結果を元に推定し、対策を考えてみました。
[キーワード] summary,Web Search API,descriptions,検索

« [2005年を振り返る・その1] その後の Musical Baton | トップページ | [2005年を振り返る・その2] セキュリティ関連の騒動 »

2005.12.26

Yahoo! 経由のアクセスが激減 - 原因の分析と対策

なぜ、12月15日付けのインデックス更新以降、この blog のアクセスが急減したか。その原因を探るには、まず、Yahoo! に当 blog (Webページ) がどういう風に評価されているか、を知る必要があります。

幸いなことに、先日、Yahoo! Japan の Web Serach API が公開されました。この API を使うと、特定のドメイン(最大30個まで指定可能)に対象を絞った検索を実行し、その結果を XML で受け取ることができます。

この XML ファイルには、以下のような内容が格納されています。

  • Web ページの title
  • Web ページの要約 (summary)
  • Web ページの URL
  • Web ページの URL (Yahoo! の用意したリダイレクタ経由)
  • Web ページの最終更新日時(もしくは、Yahoo! のクローラーの最終訪問日時)
  • 当該 URL の実体のMIMEタイプ
  • 当該 Web ページのキャッシュとそのサイズ

ここで注目すべきなのは、「Web ページの要約 (summary)」です。ここに何が格納されているかを調べることが、検索結果を評価する上での肝になります。

実験

試しに、以下のような form を作って、検索結果(XML)を取得してみました。

  1. 観測気球、観測気球フリーを対象に検索を実行
  2. 全Webページを対象に検索を実行

上記の form を使って、「コミックカードガム」というキーワードで「観測気球、観測気球フリーを対象に検索を実行」してみたところ、返ってきた「Web ページの title」、「Web ページの要約 (summary)」、「Web ページの URL」は、以下のようなものでした。

<Title>[観] Bloglines の去就</Title>
  <Summary>収集物の記録書庫 a data archive of collection -- collectible toys 2005.02.08 Bloglines の去就 ... " ドラえもんコミックカードガム | トップページ | 「輝く! 日本ブログ大賞 2005」に応募してみるテスト(BlogPet) " ...</Summary>
  <Url>http://watcher.moe-nifty.com/memo/2005/02/bloglines_.html</Url>

「ドラえもんコミックカードガム」という記事があるにも関わらず、そちらにはヒットせず、全く別の記事「Bloglines の去就」がヒットするという意外な結果になりました。

<Summary> の中身をよく読むと、

ドラえもんコミックカードガム | トップページ | 「輝く! 日本ブログ大賞 2005」に応募してみるテスト(BlogPet)

という部分がヒットしたことが分かります。この文字列は、ナビゲーション用のリンクで、各個別記事の上の方に設置してあります。当該記事の1つ前の記事、トップページ、当該記事の1つ次の記事へのリンクを並べたものです。

つまり、本来ヒットして欲しい記事ではなく、1つ隣の記事がヒットしてしまったことになります。

以上の結果から、Yahoo! が Web ページを評価するとき、まず、body 部の先頭から順番に見ていき、最初の方にある文字列、文章ほど高いポイントを与えているのではないか、という仮説を立てました。以前は、Yahoo! の Web ページ評価アルゴリズムは、head 部にある

<meta name="descriptions" content="当該 Web ページの要約" />

で示される「当該 Web ページの要約」の内容を最初に拾ってくれていたと思われます(各種状況証拠より推定)が、今回のインデックス更新では、もはや、この meta name="descriptions" を拾ってくれなくなったのかもしれません。

ということで、body 部のできるだけ最初の方に、当該 Web ページの内容を端的に表す文章(要約、キャッチフレーズ)やキーワードを載せることで、意図しない Web ページがヒットしてしまう可能性を減らせるかもしれません。さらに、あわよくば、何らかの SEO 効果も期待できるかもしれません。

とはいっても、ナビゲーションが Web ページの上の方にあるのは、ユーザビリティの観点から推奨される(場合がある)と思うし、それなりに自然だとも思うわけです。いずれは、検索エンジンの評価アルゴリズムが進化し、ナビゲーション部分は無視、あるいは低いポイントを与えるなど、誤爆の可能性を減らす方向に行くものと期待していますが、当面は、Web ページを作る側で何らかの工夫をして、人間にも検索エンジンにも優しい Web ページを書くように心がけた方がよいのかもしれませんね。

では、具体的にどんな構造の Web ページにすればいいのでしょうか。

試験的に、この「観測気球」の個別記事のページを以下のような構造にしてみました。実際に効果があるかどうかは、「次」か「次の次」の Yahoo! のインデックス更新で判明するはずです。

  • 変更前
    • ブログのタイトル
    • ブログのサブタイトル
    • ナビゲーション
    • 記事本体
  • 変更後
    • ブログのタイトル
    • ブログのサブタイトル
    • 当該記事の件名、要旨、キーワード
    • ナビゲーション
    • 記事本体

果たして、どういう結果が出るでしょうか。何ヶ月か後に、結果を報告したいと思います。

投稿者: tsupo 2005.12.26 午後 02:47 | 固定リンク | このエントリーをはてなブックマークに追加 | このエントリを del.icio.us に登録 このエントリの del.icio.us での登録状況 | このエントリを Buzzurl に追加このエントリの Buzzurl での登録状況 | このエントリをlivedoorクリップに登録 このエントリのlivedoorクリップでの登録状況 このエントリをlivedoorクリップに登録している人の数 | 酢鶏巡回中

楽天市場


ウェブログ・ココログ関連」カテゴリ内の最近の記事

日記・コラム・つぶやき」カテゴリ内の最近の記事

品揃え豊富で安い!NTT-X Store


アマゾンわくわく探検隊

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/6737/7848407

この記事へのトラックバック一覧です: Yahoo! 経由のアクセスが激減 - 原因の分析と対策:

» Yahoo! 経由のアクセスが激減 - その後 from 観測気球
結論から先にいうと、先日実施した対策は Yahoo! には効果なし。でも、Google に対しては絶大な効果があり、結局、アクセス数は増えました。 続きを読む

受信: 2006.02.05 午前 12:57

コメント

コメントを書く




※イタズラ防止のため、メールアドレスを入力しないと投稿できません。

次からのコメント入力の手間を省くために、名前やメールアドレスをcookieに記憶しますか?


URL を入力すると、その URL にリンクがはられます。
なお、メールアドレスは公開されません。ご安心ください。


ワード

ニッセン

fujisan.co.jp

楽天市場