« キーワード「プリキュア」で検索した結果 (2005年12月15日 18時4分現在) [94/94] | トップページ | キーワード「クリスマスケーキ」で検索した結果 (2005年12月15日 21時25分現在) [1/5] »
検索結果をblogに投稿するプログラム
2005.12.15
検索結果の件数が多いときに全部掲載しちゃうと大変なことになることが明らかなので(わかりやすい実例: キーワード「プリキュア」で検索した結果 (2005年12月15日 18時4分現在) [94/94])、ある程度、件数を絞る必要があります。
- 単純に全検索結果の最初の n 件だけ掲載する
- 各検索エンジンの上位 n 件づつを寄せ集め、掲載する
- 検索エンジンごとに独立した記事にし、それぞれ上位 n 件づつ掲載する
- 全検索結果に対し、何らかの方法で重み付けを行い、上位 n 件だけを表示する
いちばん最後の方法が理想的だけど、重み付けをどうやって実現するかが、難しい。完全に機械的に重み付けをするには、人工知能的なアプローチを取るか、適当に重要語彙というのをでっちあげ、その重要語彙を含むものに高い点数を与えるといった方法を採用するか。
できれば複数のサイトの検索結果を混ぜたものを同時に一覧にしたい。いまのところ、いろんな制約を考えて、1記事辺りの掲載アイテム数を30件にしている(ちなみに、40件ちょっとで 64KB の壁を越えることが経験的にわかっている)。情報量を減らせば、もっとたくさん掲載可能になるが、どこまで減らすか。さじ加減が微妙。
といった感じで、現在、試行錯誤中です。
まだまだ、利用する検索エンジンの数、検索対象サイトの数を増やしたいので、うまい突破口がないか悩み中。
投稿者: tsupo 2005 12 15 午後 07:41 | 固定リンク | Clip!! | BlogPeople Tags に登録
「実験」カテゴリ内の最近の記事
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/6737/7637769
この記事へのトラックバック一覧です: 検索結果をblogに投稿するプログラム:
コメント
コメントを書く
« キーワード「プリキュア」で検索した結果 (2005年12月15日 18時4分現在) [94/94] | トップページ | キーワード「クリスマスケーキ」で検索した結果 (2005年12月15日 21時25分現在) [1/5] »

