crontab が使えない環境で Fresh Reader で購読中のフィードを自動収集するためのツール

観測気球

収集物の記録書庫 a data archive of collection -- collectible toys

[要旨] crontab の使えないレンタルサーバを使っている人のために、Windows のタスクスケジューラ機能を使って Fresh Reader のクローラー機能を起動するツールを作ってみました。
[キーワード] FreshReader,crontab,タスクスケジューラ,クローラー

« watcher グループ | トップページ | ココログフリーにログインできない → 解決!! »

2006.02.01

crontab が使えない環境で Fresh Reader で購読中のフィードを自動収集するためのツール

最終更新: 2006年2月7日

自分の使っている Web サーバに設置できるタイプの RSS リーダ Fresh ReaderLaCoocan に設置して使ってみています

サーバサイドで動く RSS リーダとしては BloglinesはてなRSS がありますが、Fresh Reader は Bloglines を意識したユーザインターフェースになっています。Bloglines を使い慣れている人は、特に違和感なく Fresh Reader も使えると思います。

Fresh Reader の利点は、自分の使っているサーバにインストールできるので、ユーザは自分だけ(もしくはアカウントを提供した数人の知り合いのみ)なので、動作が軽いこと。Bloglines はユーザ数が多いこともあって、動作が重いときがあります。その点、Fresh Reader は軽い。あと、Bloglines はサイト名や記事のタイトルが長いと途中で切られてしまうんですが、漢字などのマルチバイト文字の途中で切られてしまうと、以後の表示がおかしくなったり、全く読めなくなったりする不具合があります。今のところ、Fresh Reader ではそういうことは起きず、Bloglines では読めなかった記事も問題なく読めています。

ただし、Fresh Reader には、一度読んだ記事を読まなかったことにする機能がなかったり、1つのフィードの中に概要と全文の両方が入っている場合にどちらを表示するかを選択できなかったり(常に概要が表示されてしまうようです)と、今後に期待といったところもあります。

ところで、サーバ設置型の RSS リーダの場合、(RSSリーダを設置先の)サーバの方でフィードを定期的に収集するのが普通です。crontab が使えるサーバは問題ないのですが、LaCoocan のように crontab が使えないサーバでは自動収集させることができません。Fresh Reader には手動収集機能があるので、それで何とかなることはなるのですが、数日間 Web にアクセスできない状態が続くと、収集しないといけないフィードの量も増えてしまい、手動収集にかなりの時間がかかってしまいます。気が短い人には耐えられないかもしれません。

そんな人のために、Fresh Reader にはクローラーオプションというサービスが用意されていて、外部から巡回指示を与えることで、クローラー(フィード収集)機能を起動することができるようになっています。このクローラーオプションを使うのもいいんですが、自力で何とかしたいという人のために、クローラーオプションの真似事をするツールを作ってみました。

クローラーオプションが実際にどういう指示(電文)をクローラーに飛ばすのかは不明ですが、私が作ったツールは、手動起動時に Web ブラウザからクローラーに送られる http リクエストと同じものを送信することで、クローラーの自動起動を実現しています。

ダウンロード

  • subcrawler110.lzh 1.10版 1.66 MB (1,749,108 バイト) [Windows用]
    for Fresh Reader 1.0 β2
  • subcrowler.lzh 1.00版 1.68 MB (1,768,744 バイト) [Windows用]
    for Fresh Reader 1.0 β

使い方、設置方法等は、上記 subcrowler.lzh もしくは subcrawler110.lzh に入っているドキュメントを参考にしてください。 Windows のタスクスケジューラ経由で本ツールを起動することで、定期的な巡回を実現することができます。

ソースを添付しましたので、Windows 以外で動かしたい人は、このソースを参考に、ツールを作成してみてください。少なくとも、どういう http リクエストを出せばいいのかはわかると思います。

変更履歴

  • Ver 1.10 2006年 2月 7日
    • (1) FreshReader 1.0 β2 版でも動くように修正
    • (2) 余分な http リクエスト(左フレーム取得)を出すのをやめた
    • (3) subcrowler → subcralwer に変更 (綴りミスを修正)
  • Ver 1.00 2006年 2月 1日
    • 最初のリリース版。LaCoocan 設置の Fresh Reader に大しても、問題なく自動巡回指示が出せることを確認
  • Ver 0.90 2006年 1月30日
    • 暫定版。LaCoocan に設置した Fresh Reader に対し、proxy 経由で接続しにいくときは問題なく動くが、直に LaCoocan の Webサーバに接続しにいくと動かないという不具合あり(Web サーバに alias が設定されてる場合に、それが alias だと見抜けないのが原因だと判明)

投稿者: tsupo 2006.02.01 午前 06:28 | 固定リンク | このエントリーをはてなブックマークに追加 | このエントリを del.icio.us に登録 このエントリの del.icio.us での登録状況 | このエントリを Buzzurl に追加このエントリの Buzzurl での登録状況 | このエントリをlivedoorクリップに登録 このエントリのlivedoorクリップでの登録状況 このエントリをlivedoorクリップに登録している人の数 | 酢鶏巡回中

楽天市場


RSS」カテゴリ内の最近の記事

プログラミング」カテゴリ内の最近の記事

品揃え豊富で安い!NTT-X Store


アマゾンわくわく探検隊

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/6737/8445785

この記事へのトラックバック一覧です: crontab が使えない環境で Fresh Reader で購読中のフィードを自動収集するためのツール:

» フレッシュリーダー β2 版を公開します from My RSS 管理人 ブログ
先週公開したフレッシュリーダーですが、たくさんの反響をいただきありがとうございます! 公開後、たくさんの方からフィードバックを頂き、それらを製品版に生かすべく現在鋭意開発中なのですが、環境に依存した対応処理や一部不具合などを改修したバージョンを先にリリースさせていただきます。 ⇒ダウンロード ⇒製品改修履歴 ⇒バージョンアップ方法(上書インストール方法) 見た目や機能にはほとんど変更ありませんので...... 続きを読む

受信: 2006.02.02 午前 09:52

» FreshReaderb に巡回指示を出すツール subcrawler 1.10版 from 観測気球
前の版は Fresh Reader 1.0 β2 に対してはうまく動かなくなってしまったので、新しく作り直しました。今回の版は、β、β2 のどちらにも対応しています。 続きを読む

受信: 2006.02.07 午前 04:22

コメント


Windows版もいいんですが、こういうののフリー版サービスか、別のサーバにインストールして、呼び出すのとかってないかなとか思ってました。って、cron 使えるサーバがあるなら、素直にそっちにインストールすれば良いだけですね A^^;;

WEB上のプログラムを指定時間に自動実行!『バーチャルCRONサービス』-ウェブコネクション
http://www.webconnection.jp/Service/VirtualCron.htm

投稿者: Tiger (2006.02.01 午前 08:52)

コメントを書く




※イタズラ防止のため、メールアドレスを入力しないと投稿できません。

次からのコメント入力の手間を省くために、名前やメールアドレスをcookieに記憶しますか?


URL を入力すると、その URL にリンクがはられます。
なお、メールアドレスは公開されません。ご安心ください。


ワード

ニッセン

fujisan.co.jp

楽天市場