Amazon オススメ商品

hidew 2007.02.12

#1524 アクセスログの 404 を見て気づいたこと

  1. とある一日の 404 Not Found
  2. 全く学習しない無能ロボット
  3. Mac IE5 の url('..') 解釈
  4. ログを書き出してくれるオススメサーバ
    1. STEP SERVER
    2. ロリポップ

とある一日の 404 Not Found

下の表は当サイトの 404 Not Found(見つからないファイル)の一部。

code 対象file            Agent
404  /voice/index.cgi    msnbot (msn のロボット)  
404  /voice/index.cgi    YST (Yahoo のロボット)  
404  /voice/index.cgi    YST 
404  /voice/index.cgi    msnbot  
404  /voice/index.cgi    msnbot  
404  /voice/index.cgi    YST 
404  /voice/index.cgi    YST
404  /voice/style/'/voice/style/h3.png'   (IE 5.17 Mac_PowerPC)  
404  /voice/style/'/voice/style/h2.png'   (IE 5.17 Mac_PowerPC)  
404  /voice/index.cgi    YST 
404  /voice/index.cgi    msnbot  

全く学習しない無能ロボット

/voice/index.cgi はブログの動的な作業を担う CGI だったが、スパム対策として 3ヶ月くらい前にリネームした。(関連 #1490 ブログのスパム対策)

にもかかわらず、msn と Yahoo のクローラーは存在しない同じファイルにアクセスし続けている。5分おきに 同じファイルにアクセスして、404 Not Found を繰り返すのは、まるでスパムだ。メジャーな検索エンジンのクローラー(収集ロボット)としてはお粗末すぎないか。

Mac IE5 の url('..') 解釈

http://stone.dialog.jp/voice/style/default.css 

の中に

background-image:url('/voice/style/h2.png')

という記述があると、Machintosh の IE5 はおかしな解釈をしてしまうようだ。しかも、

/voice/style/'/voice/style/h2.png'

というように、アクセスログに {'} シングル・クオート がくっついているのは奇妙だ。

答えはこちら。

http://www.zspc.com/documents/css2/associate/atimport.html

Macintosh版 IE 5.0:[△]
URIの前後に「'」をつけた場合はスタイルを取り込まない。
(「@import url('sample.css')」「@import 'sample.css'」のような指定は無効となる)

全然知らなかった。

ログを書き出してくれるオススメサーバ

STEP SERVER

月額250円という料金(自サーバの電気代やHDD消耗を考えたらほとんど無料みたいな値段)で、何でもできる。(Perl, PHP, Ruby, .htaccess, MySQL, ML, SSL, ImageMagick, GD, 生ログ, ..)

当ブログも stepserver にて、Perl + PHP + MySQL + .htaccess を組み合わせて運用している。

ロリポップ

http://lolipop.jp/

http://lolipop.jp ..

※上級者向けに生ログのダウンロードも可能です

コストパフォーマンスは stepserver と同様に高いが、ページのデザインやネーミングにクセがありすぎ。このセンスに私はついていけない。

*