soholiu 发表于 2006-12-16 03:41:20

火车头无法采集的网站

火车头碰到的难题,火车头采集网页是一页一页打开采集的,有的网站开头加了一段代码.
<%
server_v1=Cstr(Request.ServerVariables("HTTP_REFERER"))
server_v2=Cstr(Request.ServerVariables("SERVER_NAME"))
if mid(server_v1,8,len(server_v2))<>server_v2 then
response.write "<table width=""400"" border=""1"" align=""center"" cellpadding=""0"" cellspacing=""0"" bordercolorlight=""#4F98F9"" bordercolordark=""#FFFFFF"">"
response.write "<tr><td height=""25"" align=""center"" background=""Images/skin/0/back.gif"" style=""font:9pt Verdana""><b><font color=""#FFFFFF"">系统安全提示</font></b></td></tr>"
response.write "<tr><td height=""50"" align=""center"" style=""font:9pt Verdana"">你提交的路径有误,禁止从站点外部提交数据,请不要乱改参数! </td></tr></table>"
response.end
end if
%>

意思是必须从他的网站上点开才能浏览,直接从浏览器地址栏上输入网址而无法浏览.对于这样的网站火车头也没办法.有没有高人有办法采集得到呢?

[ 本帖最后由 soholiu 于 2006-12-16 03:46 编辑 ]

monface 发表于 2006-12-16 09:57:24

防采集?

netdream 发表于 2006-12-16 10:25:08

能给个地址试试吗

soholiu 发表于 2006-12-16 10:42:10

我的网站 http://qhooo.com/yefriend ,我提供个帐号:254728861 密码:123456
管理员来测试一下,把会员资料页采集下来. 反正我是无法采集得到的. 从地址栏直接输入会得到 "你提交的路径有误,禁止从站点外部提交数据,请不要乱改参数! "这个.所以用火车头采集将采得的全是空白.老大来试试,希望能突破.

史巴托的腹肌 发表于 2006-12-16 13:15:59

楼上的楼上的mm怎么一天到晚都在:loveliness:

史巴托的腹肌 发表于 2006-12-16 13:38:10

用火车登陆不管用:Q   继续整
网站速度慢阿

xyyfx 发表于 2006-12-17 00:42:01

呵呵…………有些网站,比如霏凡的论坛就采集不了,呵呵!都是高手!不同同程序做出来的论坛可以,有些设置了登陆才可以浏览,但是用火车的前面那个登陆才能采集的功能却不管用,估计是站长们加了代码了!不过,火车以后肯定能采,没有火车采不到的!:) 支持火车头!
页: [1]
查看完整版本: 火车头无法采集的网站