« 子供の事典大百科サンダーバード トレーシー島大図解アートボックスedition | トップページ | オシャレ魔女ラブandベリー ビーチハウス in 江ノ島 »
2006.06.25
ココログの生成する Atom 1.0 フィードの中身がおかしい
2006年6月24日の夜から、Bloglines で購読している Atom 1.0 の表示がおかしくなってしまいました。 今のところ、おかしいのはココログのみ(というか、ココログ以外の Atom 1.0 なフィードはほとんど購読していないので、他の Atom 1.0 の状況はよくわかりません)。
少なくとも、24日の未明に投稿したものは問題がないのですが、24日の夜に投稿したものはおかしくなっています。記事全文を配信している場合、通常、記事本文は
<content type="text/html" mode="escaped" xml:lang="ja-JP" xml:base="http://watcher.moe-nifty.com/memo/"> <![CDATA[>div xmlns="http://www.w3.org/1999/xhtml"><p> 記事本文 </p> </div>]]> </content>
のように CDATA として格納されるのですが、おかしくなっている記事に関しては、CDATA ではなく、生の xhtml がそのまま埋め込まれています。試しに Feed Validator にかけてみたら、エラーが報告されました。
少なくとも mode="escaped" を指定している以上、CDATA じゃないとまずいですよねぇ。
24日の何時からかはわかりませんが、急におかしくなり始めたようです。 これも「キャッシュシステムのせい」なんでしょうか? たぶん、違うと思いますが。 これではますます、livedoor Reader の443ヶ月(そろそろ 444ヶ月 になるかな?)問題の解決から遠ざかる一方。 今までの443ヶ月問題の原因もココログ側にあるのかなぁ? という気がしてきました。
この問題が解決するまでは、記事全文流すのはやめて、概要のみ流すようにした方がいいのかなぁ?
参考
おかしくなる部分は、Atom 1.0 template の以下の部分です。
<MTWeblogOwnerHas field="feeds_full_content">
<MTWeblogIfFullRSSContent>
<$MTEntryAtomContent$>
</MTWeblogIfFullRSSContent>
</MTWeblogOwnerHas>
上記の MT テンプレートタグの展開処理で、何か問題が発生しているのではないかと思われます。
投稿者: tsupo 2006.06.25 午後 09:23
| 固定リンク
|
|
| ![]()
|
|
アマゾンわくわく探検隊
トラックバック
この記事のトラックバックURL:
この記事へのトラックバック一覧です: ココログの生成する Atom 1.0 フィードの中身がおかしい:
» クイック投稿は大丈夫なのだけど... from T's Diary
何だか、昨夜(6/24)からココログの調子が変だ。 わたしが変だと感じているのは、 続きを読む
» クイック投稿は大丈夫なのだけど... from T's Diary
■追記(2006/06/27) : どうやら、愛用している タブブラウザ Sleipnir のモードが「デフォルトモード」ではなく、「セキュリティモード」になっ 続きを読む
» livedoor Reader の443ヶ月問題、解決? from 観測気球
やっと直った? とりあえず、今まで流れてきてなかった未読がちゃんと流れてくるようになりました。「443ヶ月前」の表示もなくなりました。このまま正常に読み続けることができればいいんですが。... 続きを読む
コメント
こんにちは、ココログスタッフです。
24 日前後にはココログに何も修正は加えていません。
ATOM feed ですが、 content の子要素が html ではなく xhtml であれば、一番外側の div タグに xmlns が指定されていますので、CDATA はなくとも XML valid なはずです。
ただ、type="text/html" mode="escaped" としているのに、XHTML として扱うのは ATOM feed として変ですね。
typepad.jp や typepead.com はどうなっているのかなあ……
投稿者: 某めがねのひと (2006.06.26 午後 04:14)
こんにちは、ココログスタッフです。
ちょっと調べてみました。
MTEntryAtomContent の処理で、
・記事本文が XML なら type="application/xhtml+xml"
・記事本文が XML でないなら type="text/html" mode="escaped"
としていますね。
XML かどうかの判別の精度が良くない可能性はありますが、そうなった記事の本文を確認してもらえますでしょうか。
投稿者: 某めがねのひと (2006.06.26 午後 04:34)
どういうときに CDATA になって、どういうときにならないのか、今のところ条件がわかっていません。とりあえず、記事本文が長いと、CDATA になりやすく、短いと CDATA になりにくい傾向があるようです。
投稿者: tsupo (2006.06.27 午前 03:03)
本来は、type="application/xhtml+xml" の場合は、生 xhtml、type="text/html" mode="escaped" のときは CDATA になるんですよね。
確かに、「XML かどうかの判別の精度が良くない」のが原因なのかもしれません。
なぜ、24日の夜(午後)から急に今回の現象が起きるようになったのかは不明です。
Bloglines の方も日々微妙に挙動が変わってますので、ひょっとすると、もっと前から、起きてたんだけど、今までは Bloglines の方でリカバリーされてて発覚してなかった、それが 24日近辺の Bloglines の挙動の変更により発覚した、ということなのかもしれません。
断定できるだけの証拠がないので、いろいろ推定するしかないのが現状ですね。
投稿者: tsupo (2006.06.27 午前 03:14)
あと、記事投稿時の「テキストフォーマット」が「改行を反映させる」か「なし」かで傾向が変わるかも、と思ったんですが、有意な差はないようです。
投稿者: tsupo (2006.06.27 午前 03:16)



