bookey の「タグ候補」表示機能

観測気球

収集物の記録書庫 a data archive of collection -- collectible toys

[要旨] bookey の「タグ候補」表示機能、今のままではいまいちなので、何とかしようと思っているのですが、なかなかいいアイデアが出てきません。
[キーワード] 特徴語抽出,タグ候補,形態素解析

« カテゴリ別アーカイブの一部が更新されない | トップページ | って言ってたよ(BlogPet) »

2007.02.26

bookey の「タグ候補」表示機能

最近はてブにも同時ポストをするようになり、bookeyを使うようになりました。
タグ候補も表示してくれるのですが、文面から判断しているらしくちょっと微妙だったりします。

これで完璧?del.icio.usとの付き合い方 | caramel*vanilla

現時点では、bookey のタグ候補を表示する仕組みは、以下のようになっています。

  • ブックマークしようとしているWebページが、すでに「はてなブックマーク」に登録されている場合は、エントリページから、よりたくさんの人が使っている順にタグを取り出します。ただし、1人しか使ってないタグは対象外とします。
  • 続いて、1470.net の「タグ自動抽出API」を使って、候補を最大20個取得します。
  • ここまでで、タグの候補が20個に満たない場合は、bulkfeeds の「形態素解析 + 特徴語抽出」API を使って、候補を最大20個取得します。

上記の手順で取得したタグの候補(特徴語)を最大20個だけ残し、ブックマーク登録ダイアログに表示しています。

で、ここしばらくの間、1470.net で不調が続いているようで、実質的に、bulkfeeds の API によるタグ候補しか表示されないことが多くなっています。以前は、bulkfeeds の API の精度もかなりよかったのですが、最近は精度が悪くなっているようで、caramel*vanilla の人が言うように「ちょっと微妙」なことになっています。

そこで、1470.net の API の代わりに使えそうな API として、以下のものを採用するかどうか、悩んでいるところです。

KOSHIAN の方は、個人の自宅サーバ(zuzara.dyndns.org)で動いているので、あんまり激しく使うのは忍びない(それを言ったら、1470.net も bulkfeeds もそうなんですが)のと、BlogPet の方は、BlogPet の管理画面にログインしている状態でないと使えない(つまり、BlogPet の会員じゃないと使えない)という問題があります。

海外にもタグ候補抽出サービスは散見されるんですが、日本語に対応してないのと、1日あたりのクエリ回数の制限がきついサービス(1日3回までとか)がほとんどなのとで、いまいち使えません。

どこか大手が特徴語抽出サービス(API)を公開してくれるといいんですが。 あとは、ローカルPC に chasen (もしくは、他の形態素解析プログラム)がインストールされていれば、chasen を使うようにする、というような実装も考えられますが、chasen をインストールしてる人って、すごく限られますよねぇ。

という感じで、悩んでいるところです。何か、いいアイデアがあれば、教えてください。最悪、自前で特徴語抽出処理を書くことになるのかなぁ。悩むところ。

追記

fubaさんの「キーワード抽出君」 (javascript keyword(tag) extraction) というのもありますね。これも個人でやっているサービスなので、負荷が問題になりそう。

もう1件、追加。Drk7jpさんところの Google Similar ように作成された「特徴語リストを取得する API 」というのがあります。詳細は、「埋め込み e-Words を試してみた :: Drk7jp」。これも個人でやっているサービス。

投稿者: tsupo 2007.02.26 午後 11:03 | 固定リンク | このエントリーをはてなブックマークに追加 | このエントリを del.icio.us に登録 このエントリの del.icio.us での登録状況 | このエントリを Buzzurl に追加このエントリの Buzzurl での登録状況 | このエントリをlivedoorクリップに登録 このエントリのlivedoorクリップでの登録状況 このエントリをlivedoorクリップに登録している人の数 | 酢鶏巡回中

楽天市場


プログラミング」カテゴリ内の最近の記事

品揃え豊富で安い!NTT-X Store


アマゾンわくわく探検隊

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/6737/14060723

この記事へのトラックバック一覧です: bookey の「タグ候補」表示機能:

» ソーシャルブックマーク管理ツール bookey 0.28版 from 観測気球
0.28版をリリースします。タグ候補表示機能をいじってみました。はてなダイアリーキーワード自動リンクAPI と KOSHIAN を使うようにしてみました。かなり精度がよくなったと思います。 続きを読む

受信: 2007.03.06 午前 07:46

» Re: bookey の「タグ候補」表示機能 from [牛] うしぶろぐ
bookey の「タグ候補」表示機能より (´_ゝ`)ノキアの携帯は優れた機能を持ってるけど大体ダサいぞ 続きを読む

受信: 2007.03.13 午前 06:45

コメント


tsupoさん,はじめまして.この記事にあがっているような1470やblogpetなどからのアクセスをTrackfeed経由で知りました.リンク元を辿ると,tsupoさんにブックマークしていただいたお陰のようです.ありがとうございました.
さて,添えられていたコメントを拝見致しました.
今はブログサービスであるseesaaを利用している身なので,サーバーのことは詳しくないのですが...SSI機能を持つサーバーを使えば,HTML内におまじないを記述すれば,サーバー側で動的に処理してくれるのですね.
動的生成といっても,どこで何をやらせるかによって,いろいろな手段があるのですね.これまた勉強になりました.

投稿者: yanz (2007.03.01 午前 09:54)

コメントを書く




※イタズラ防止のため、メールアドレスを入力しないと投稿できません。

次からのコメント入力の手間を省くために、名前やメールアドレスをcookieに記憶しますか?


URL を入力すると、その URL にリンクがはられます。
なお、メールアドレスは公開されません。ご安心ください。


ワード

ニッセン

fujisan.co.jp

楽天市場