netsky 发表于 2007-3-12 00:41:37

火车如何采集防采集的网站?

我想采集一个论坛,规则都做好了,但是采集的时候发现只能采集一条记录,后面的就采集不到了,设置了COOKIE的,

论坛地址:http://bbs.txwm.com/list.asp?boardid=43

以下是站点规则,测试任何一个页面都没有问题,但采集的时候只能采一条记录!


标题:
<title>      </title>
内容:
<font color=red>[(*)]</font>   ','200
排除:
<font color=#000066>[(*)]</font>

此主题相关图片如下:

','200(*)'))

<img src=Skins/Default/emot/(*).gif border=0 align=middle onmousewheel="return bbimg(this)" onload="javascript:if(this.width>screen.width-500)this.style.width=screen.width-500;">

<a href="(*)</font></a>

(*)','


[ 本帖最后由 netsky 于 2007-3-12 00:49 编辑 ]

rq204 发表于 2007-3-14 16:34:23

对用cookie或session控制访问的网站你还是别想了;;;;;;;;;;
页: [1]
查看完整版本: 火车如何采集防采集的网站?