« コレジャナイロボ ソフビ版 | トップページ | 今週のお買い物 (2005.11.13~11.19) »
2005.11.18
ココログにファイルをアップロードするとファイル名が変わってしまう
よくよく見ると、ココログのコントロールパネルでアップロードしたものは、大文字から小文字に勝手に変更されてたじゃないですか。で、Googleは「大文字か小文字かもちゃんとチェックしてる、と。
[☆] Google Sitemapsに日本語版ができたけど
そうなんですよ。私も16日の夜に Google Sitemap の「確認」用ファイルをアップロードしようとして、あきらめてしまいました。ファイル名に含まれる大文字が小文字に変えられてしまう現象は以前から気付いてはいたんですが、Google の方が大文字、小文字を無視してアクセスしてくれないかな、と期待したんですが、やっぱり甘かったですね。
大文字が小文字に変わってしまうのは、ファイルをアップロードした直後に動くサーバ側のプログラムのどこかに原因があるようですが、実は不具合ではなくて、そういう仕様(わざと大文字を小文字に変換している)なのかもしれません。Webサーバによっては、大文字小文字の区別をせず、どちらでも同一ファイルにアクセスできるように設定できるものもありますが、少なくともココログのWebサーバはそういう風にはなっていないようです。
管理画面でのアップロードより、「ここあっぷる」でのアップロードの方がいい点は、「ここあっぷる」の場合、アップロードしようとしているファイルの名前が英大文字小文字混じりの場合でも、アップロードした後のファイルの名前が変わらないこと。管理画面だと、大文字が強制的に小文字に変換されてしまいます。大文字と小文字をきちんと区別して扱いたい人は、ぜひ「ここあっぷる」を使ってみてください。
[観] ココログにファイルをアップロードするツール「ここあっぷる」 Ver1.14
ということなんですが、XML-RPC API 経由でのアップロードの場合は、ブログのトップディレクトリ以下のサブディレクトリにしかアップロード(アクセス)できません。ココログの場合、ブログのトップディレクトリとサイトのトップディレクトリが違うのですが、Google Sitemap の「確認」用ファイルはサイトのトップディレクトリ(ルートディレクトリ)直下におく必要があり、XML-RPC API 経由ではアップロードできません。
ちなみに、この「観測気球」の場合
- サイトのトップディレクトリ: http://watcher.moe-nifty.com/
- ブログのトップディレクトリ: http://watcher.moe-nifty.com/memo/
になります。
ココログの場合、ブログのトップディレクトリとサイトのトップディレクトリが違う
「確認」用ファイルを置かなくても、現状、各ブログのトップディレクトリ直下に置いてある sitemap.xml はちゃんとクロールされているようなので、とりあえず、今のままでもいいかな。そうはいっても、大文字を小文字に変えてしまうのは、やめて欲しいと思います。 > ココログ
ココログの管理画面のコントロールパネルのファイルマネージャでのアップロードだけではなく、投稿用画面の「画像の挿入」や「ファイルの挿入」ボタンを使ってのアップロードでも大文字→小文字変換が働くので、大文字小文字を厳密に区別してファイルをアップロードしたい場合は、XML-RPC API 経由で(つまり、blog クライアントや「ここあっぷる」のような専用ツールを使って)アップロードする必要があります。このままでは不便ですので、大文字を小文字に変えてしまう処理を外していただければ、多くの人が幸せになれると思います。
ま、sitemaps.xmlを作ればいいんですけど、1000以上ある記事ファイルを全部入れたらとんでもないことになるし、記事投稿のたびにココログに大変負担をかけそう。なんかいいアイデア募集中。
[☆] Google Sitemapsに日本語版ができたけど
確かに、インデックスファイルの再構築と同期させると大変なことになりそうですが、同期させるのをやめて、ときどき気が向いたときに sitemap.xml だけを手動で再構築する、とか。面倒ですけどね。あとは、最初のクロールが終わるまでは sitemap.xml を Google Sitemap にアクセスさせて、いったんクロールされた後は RSS の方をアクセスさせるように設定を切り替える、という方法も有効だと思います。
たぶん、もう日本語に対応したから大丈夫でしょうけど、sitemap.xml を渡す方式では、ファイル名(というか URL)しか Google Sitemap に渡らないので、Google でエゴサーチしても記事の名前ではヒットせず、URL でようやくヒットする、ということが起こりがちです。Sitemap はなぜか記事の中身をちゃんと読んでくれないことがあるようなんですよね。で、他のサイトからリンクが張られたタイミングで Goolebot のアクセスがあると、その記事だけはちゃんと記事の名前も拾ってくれる。この変辺、推定が入っているので、どこまで正しいのかわかりませんが、とにかく、sitemap.xml 設置後は、記事の名前では検索にヒットしない傾向が高いことは確かなのです、少なくとも、この「観測気球」では。
ってことで、現状、うまくクロールされているようなら、sitemap.xml を別に置かなくてもいいのではないかな、という話でした。
関連記事
投稿者: tsupo 2005.11.18 午前 05:15
| 固定リンク
|
|
|
|
|
アマゾンわくわく探検隊
トラックバック
この記事のトラックバックURL:
この記事へのトラックバック一覧です: ココログにファイルをアップロードするとファイル名が変わってしまう:
» Google Sitemap β 日本語版 from (遊) あそびや(asobiya)~★
怒濤のリリースラッシュですね。Google Baseだって、まだ、まともに試していないってのに、今度は Google Sitemap の日本語版だそうです。 グーグルは11月17日、ユーザーが自分のサイトをGoogleに登録できるサービス「... 続きを読む
» この際Google Sitemapもやってみる from 大阪てきとー日記
最近のGoogleは、怒濤の新サービスラッシュで、これでもかっ!と畳みかけてくるので、付いていくのが大変……
と言うか、ついて行けてません(^_^;) 続きを読む
コメント
こんにちは。
何で小文字に変えていたのかは知りませんが、今の typepad.{com|jp} は小文字化していないようなので、合わせて小文字化しないようにしました。
投稿者: 某めがねのひと (2005.11.18 午後 02:27)
早速の対応、ありがとうございます。
これで、Google Sitemap の「確認」用ファイルを設置することができます。
投稿者: tsupo (2005.11.18 午後 03:07)
おお、入れ違いで要望を上げてしまいました。素晴らしい対応です。ありがとうございました。
投稿者: Tiger (2005.11.18 午後 04:11)