検索ロボットがアクセスカウンタを回さないようにするからの派生。
調べる
baiduspiderでググると、かなり迫害されてる様子の百度さんですが、俺んとこでは少なくともアクセス数ではヤフー・MSNに次いで3位だし、ヤフーの半分以下。
robots.txtやMETAを無視するってのは、実際やってみてないからわからないけど、少なくともこのサイトに関しては、検索に引っかかって困るようなファイルも無いしってことで、俺にとってはそんな害のあるものではないかなぁ。と。
試す
ロボット自体が無害だとすれば、あとはその中国産の検索エンジンとはどんなものかと、change.log が壊れておりで百度検索してみる。
この検索ワードは、Windows - 壊れたファイル(未解決)の文中でググったもので、そのエントリーを書いた当時Googleでのヒットは無かった。
今、このエントリーを書いてる時点でもヒットはうちだけ。
しかし百度はいっぱい検索結果を出してくれた。とは言っても、ほとんど単語を勝手に区切って検索しただけで目的の情報に辿り着けなさそうだけど、ひとつそのまんまの検索ワードのあるページがヒットしてる。
2件目にヒットしてるものだけども、にちゃんのスレッドのキャッシュ。
ただ、検索ワードの「change.log が」と「壊れており」の間に改行が入ってるだけで、googleはこれを拾ってないみたい。
もっと試す
更に、3日前に書いたこのサイトのエントリーのタイトル「フレッツ光プレミアムのCTUのルータ機能の限界?」で検索してみると、
Googleではこのサイトは出ないけど、百度では一番上にヒットする。
そんな特異な検索ワードが何の役に立つといえばそれまでだけど、これはこれで面白いし、更新してから検索結果に出るまでが早いのはうれしい。
まぁ、そのほかちょろちょろと検索してるとやっぱGoogleのほうがいいなぁという感じはするけど、ググってダメなら百度ってみるのも悪くないかもしれないぐらいの印象。
ということは
とりあえず、今んとここのサイトには、DDoSかと思うような無茶なアクセスも無いし、拒否するほどのことでもないかなぁって感じで、検索ロボットがアクセスカウンタを回さないようにするに続く。
注記
1.検索ワード2種類しか試してない上に、百度のほうがいいのしか書いてないけど、「いいとこもある」ってだけで百度の中の人とかそーゆーわけじゃないですよ。
2.googleとしか比較してないのは俺が普段googleしか使わないからです。
2007.08.26追記
百度のサイト内に、Baidu.jp、Baidu Spiderに関する御詫びと対処法についてというページが3月8日付けで。
ロボットの無茶なアクセスはやめますという内容のようだけど、すぐには改善されなかったのかな?
じゃなかったらBaiduspiderでググった結果はあんまりだしな。
しかしまぁ、
「日本の皆様、始めまして。
」
とか一文目から飛ばし気味の外人クオリティな日本語。
日本人スタッフおらんのかい。
2007.12.21追記
サイト立ち上げから半年ぐらいが経ってもう一度確認。
アクセス解析で捕まえたロボットは900体ほど。
そのうち、
1位:ヤフー・・・478体
2位:msn・・・233体
3位:yeti・・・75体
となった。
百度は61体で、グーグルはなんと27体だけ。
捕まえ忘れてんのかね?
まぁ連続アクセスはカウントしてないから、微妙な内容ではあるけど。
ちなみに、お客さんを連れてきてくれた検索サイトさんは、
全部で2647人のうち、
1位:グーグル・・・2419人(81.4%)
2位:msn・・・156人(5.9%)
3位:ヤフー・・・23人(0.9%)
と。
百度は1人だけ。
まぁ、1人あったことが驚きなレベルの知名度っぽいけど。
しかしグーグルすげぇな。
ロボットは全然来ないのにお客さん大勢連れてくる。
うる
どぅもおジャマします。
うちにもこのロボット来ます。
私もサイトが重くなるようなアクセスをしてくるわけでもないので、今の所様子見してます。
それより気になるのがDomainToolsからのドメイン指定のアクセスです;
誰が何のためにこんなアクセス法をして来るのかが謎で不気味です…о