#1524 アクセスログの 404 を見て気づいたこと
とある一日の 404 Not Found
下の表は当サイトの 404 Not Found(見つからないファイル)の一部。
code 対象file Agent 404 /voice/index.cgi msnbot (msn のロボット) 404 /voice/index.cgi YST (Yahoo のロボット) 404 /voice/index.cgi YST 404 /voice/index.cgi msnbot 404 /voice/index.cgi msnbot 404 /voice/index.cgi YST 404 /voice/index.cgi YST 404 /voice/style/'/voice/style/h3.png' (IE 5.17 Mac_PowerPC) 404 /voice/style/'/voice/style/h2.png' (IE 5.17 Mac_PowerPC) 404 /voice/index.cgi YST 404 /voice/index.cgi msnbot
全く学習しない無能ロボット
/voice/index.cgi
はブログの動的な作業を担う CGI だったが、スパム対策として 3ヶ月くらい前にリネームした。(関連 #1490
ブログのスパム対策)
にもかかわらず、msn と Yahoo のクローラーは存在しない同じファイルにアクセスし続けている。5分おきに 同じファイルにアクセスして、404 Not Found を繰り返すのは、まるでスパムだ。メジャーな検索エンジンのクローラー(収集ロボット)としてはお粗末すぎないか。
Mac IE5 の url('..') 解釈
http://stone.dialog.jp/voice/style/default.css
の中に
background-image:url('/voice/style/h2.png')
という記述があると、Machintosh の IE5 はおかしな解釈をしてしまうようだ。しかも、
/voice/style/'/voice/style/h2.png'
というように、アクセスログに {'} シングル・クオート がくっついているのは奇妙だ。
答えはこちら。
http://www.zspc.com/documents/css2/associate/atimport.html
Macintosh版 IE 5.0:[△]
URIの前後に「'」をつけた場合はスタイルを取り込まない。
(「@import url('sample.css')」「@import 'sample.css'」のような指定は無効となる)
全然知らなかった。
ログを書き出してくれるオススメサーバ
STEP SERVER
月額250円という料金(自サーバの電気代やHDD消耗を考えたらほとんど無料みたいな値段)で、何でもできる。(Perl, PHP, Ruby, .htaccess, MySQL, ML, SSL, ImageMagick, GD, 生ログ, ..)
当ブログも stepserver にて、Perl + PHP + MySQL + .htaccess を組み合わせて運用している。
ロリポップ
※上級者向けに生ログのダウンロードも可能です
コストパフォーマンスは stepserver と同様に高いが、ページのデザインやネーミングにクセがありすぎ。このセンスに私はついていけない。