Mar 11, 2006

对百度mp3搜索说不

关键词: 百度搜索 MP3 防止盗链 htaccess设置 robots.txt

昨天查看网站log时候,发现了一件非常令人气愤的事情。
我明明在自己的网站中设置了禁止所有网络爬虫访问Music子目录:

User-agent: *
Disallow: /Music/

但是日志中显示3月10日一天就有来自百度mp3搜索的几百个访问,这些访问无一例外的采用206 partial content方式,也就是说,他们并不是通过我的网页访问网站中的mp3文件,而是直接通过baidu的mp3搜索下载!!
通过仔细翻阅那几天的日子,我发现更恐怖的事情,baidu的所谓国际标准机器人居然没有访问我的robots文件,就对我的网站内容进行扫描。这意味着我并不希望被搜索引擎收录的mp3文件都会暴露在大庭广众之下。查看日志还可以发现,一天数百兆甚至接近1G的数据流量竟然有80%是从那不守规矩的百度MP3搜索引擎。我一个月才250G流量限制,现在才不到十个mp3文件一天就可以上G流量,要是以后多点mp3,我还怎么活啊。

所以,我们必须对百度疯狂盗链说不!(其实盗链不光百度,但目前来看,就百度的mp3搜索最无耻)
下面是对.htaccess文件的设置,如果有使用apache服务器的网站站长深受百度mp3搜索的骚扰,可以试一试下面的方法。

1.是屏蔽来自百度mp3的搜索。
2.是防盗链设置,禁止除了白名单中地址外,其他所有地址对mp3文件的直接访问。

我就不信百度现在还能来盗我的链, :evil:

RewriteEngine on
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www\.)?znsunimage.com(/)?.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://www\.znsunimage\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://blog\.znsunimage\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://click\.znsunimage\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://gallery\.znsunimage\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(.*)\.spaces\.live\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(.*)\.wordpress\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://web\.hku\.hk/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://www\.hku\.hk/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://forum\.xitek\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://forum\.pixelpost\.org/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://del\.icio\.us/.*$ [NC]
RewriteCond %{HTTP_REFERER} !^http://(.*)\.feedburner\.com/.*$ [NC]
RewriteCond %{HTTP_REFERER} mp3\.baidu\.com [NC,OR]
RewriteCond %{HTTP_REFERER} 202\.108\.23\.172 [NC,OR]
RewriteCond %{HTTP_REFERER} www\.xqxp\.com [NC,OR]
RewriteRule .*\.(mp3|mp4|rar|jepg|jpg|pdf)$ - [F]

注:robots文件标准是给各个搜索引擎的规范,是所有搜索引擎必须遵守的国际准则。和百度比,google,yahoo的机器人都很乖,都是先访问robots文件才进行抓取。baidu的行为不是无耻,是相当的无耻~

Post by SUN @ 11:43 am | Technology, Website | Add to del.icio.us | Digg This!
(Required)
(Required, will not be published)
:mrgreen: :| :twisted: :arrow: 8O :) :? 8) :evil: :D :idea: :oops: :P :roll: ;) :cry: :o :lol: :x :( :!: :?: