火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3296|回复: 4

使用加速乐防采集的网站如何采集?

[复制链接]
发表于 2012-12-25 21:50:05 | 显示全部楼层 |阅读模式
使用加速乐防采集的网站如何采集?

规则设置了半天
最后采集的时候提示全部失败
打开WebPostError.txt文件一看
里面提示如下:

ID:3
网址:http://xxxxxx.com/2364/index.shtml
Header:HTTP/1.1 404 Not Found
Content-Type:text/html
Content-Length:1308
Accept-Ranges:bytes
Date:Tue, 25 Dec 2012 13:44:23 GMT
Connection:keep-alive
age:0
Server:jiasule-WAF http://www.jiasule.com/

源代码:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<HTML><HEAD><TITLE>无法找到该页</TITLE>
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=GB2312">
<STYLE type="text/css">
  BODY { font: 9pt/12pt 宋体 }
  H1 { font: 12pt/15pt 宋体 }
  H2 { font: 9pt/12pt 宋体 }
  A:link { color: red }
  A:visited { color: maroon }
</STYLE>
</HEAD><BODY><TABLE width=500 border=0 cellspacing=10><TR><TD>

<h1>无法找到该页</h1>
您正在搜索的页面可能已经删除、更名或暂时不可用。
<hr>
<p>请尝试以下操作:</p>
<ul>
<li>确保浏览器的地址栏中显示的网站地址的拼写和格式正确无误。</li>
<li>如果通过单击链接而到达了该网页,请与网站管理员联系,通知他们该链接的格式不正确。
</li>
<li>单击<a href="javascript:history.back(1)">后退</a>按钮尝试另一个链接。</li>
</ul>
<h2>HTTP 错误 404 - 文件或目录未找到。<br>Internet 信息服务 (IIS)</h2>
<hr>
<p>技术信息(为技术支持人员提供)</p>
<ul>
<li>转到 <a >Microsoft 产品支持服务</a>并搜索包括&ldquo;HTTP&rdquo;和&ldquo;404&rdquo;的标题。</li>
<li>打开&ldquo;IIS 帮助&rdquo;(可在 IIS 管理器 (inetmgr) 中访问),然后搜索标题为&ldquo;网站设置&rdquo;、&ldquo;常规管理任务&rdquo;和&ldquo;关于自定义错误消息&rdquo;的主题。</li>
</ul>

</TD></TR></TABLE></BODY></HTML>

========分隔线=======
ID:1
网址:http://xxx.com/2374/index.shtml
Header:HTTP/1.1 404 Not Found
Content-Type:text/html
Content-Length:1308
Accept-Ranges:bytes
Date:Tue, 25 Dec 2012 13:44:23 GMT
Connection:keep-alive
age:0
Server:jiasule-WAF http://www.jiasule.com/

源代码:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<HTML><HEAD><TITLE>无法找到该页</TITLE>
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=GB2312">
<STYLE type="text/css">
  BODY { font: 9pt/12pt 宋体 }
  H1 { font: 12pt/15pt 宋体 }
  H2 { font: 9pt/12pt 宋体 }
  A:link { color: red }
  A:visited { color: maroon }
</STYLE>
</HEAD><BODY><TABLE width=500 border=0 cellspacing=10><TR><TD>

<h1>无法找到该页</h1>
您正在搜索的页面可能已经删除、更名或暂时不可用。
<hr>
<p>请尝试以下操作:</p>
<ul>
<li>确保浏览器的地址栏中显示的网站地址的拼写和格式正确无误。</li>
<li>如果通过单击链接而到达了该网页,请与网站管理员联系,通知他们该链接的格式不正确。
</li>
<li>单击<a href="javascript:history.back(1)">后退</a>按钮尝试另一个链接。</li>
</ul>
<h2>HTTP 错误 404 - 文件或目录未找到。<br>Internet 信息服务 (IIS)</h2>
<hr>
<p>技术信息(为技术支持人员提供)</p>
<ul>
<li>转到 <a >Microsoft 产品支持服务</a>并搜索包括&ldquo;HTTP&rdquo;和&ldquo;404&rdquo;的标题。</li>
<li>打开&ldquo;IIS 帮助&rdquo;(可在 IIS 管理器 (inetmgr) 中访问),然后搜索标题为&ldquo;网站设置&rdquo;、&ldquo;常规管理任务&rdquo;和&ldquo;关于自定义错误消息&rdquo;的主题。</li>
</ul>

</TD></TR></TABLE></BODY></HTML>

========分隔线=======
发表于 2012-12-25 22:14:17 | 显示全部楼层
你这个信息是发布失败呢.
 楼主| 发表于 2012-12-25 22:21:29 | 显示全部楼层
{:soso_e115:}

那怎么会出现一个加速乐的网址呢?

我用同样的办法采集其他网站没有这个提示的
 楼主| 发表于 2012-12-25 22:34:38 | 显示全部楼层

一检查
发布接口真的不对...

非常感谢!
 楼主| 发表于 2012-12-25 22:35:00 | 显示全部楼层
303718 发表于 2012-12-25 22:14
你这个信息是发布失败呢.



一检查
发布接口真的不对...

非常感谢!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-22 18:01

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表