|
火车头碰到的难题,火车头采集网页是一页一页打开采集的,有的网站开头加了一段代码.
<%
server_v1=Cstr(Request.ServerVariables("HTTP_REFERER"))
server_v2=Cstr(Request.ServerVariables("SERVER_NAME"))
if mid(server_v1,8,len(server_v2))<>server_v2 then
response.write "<table width=""400"" border=""1"" align=""center"" cellpadding=""0"" cellspacing=""0"" bordercolorlight=""#4F98F9"" bordercolordark=""#FFFFFF"">"
response.write "<tr><td height=""25"" align=""center"" background=""Images/skin/0/back.gif"" style=""font:9pt Verdana""><b><font color=""#FFFFFF"">系统安全提示</font></b></td></tr>"
response.write "<tr><td height=""50"" align=""center"" style=""font:9pt Verdana"">你提交的路径有误,禁止从站点外部提交数据,请不要乱改参数! </td></tr></table>"
response.end
end if
%>
意思是必须从他的网站上点开才能浏览,直接从浏览器地址栏上输入网址而无法浏览.对于这样的网站火车头也没办法.有没有高人有办法采集得到呢?
[ 本帖最后由 soholiu 于 2006-12-16 03:46 编辑 ] |
|