火车如何采集防采集的网站?
我想采集一个论坛,规则都做好了,但是采集的时候发现只能采集一条记录,后面的就采集不到了,设置了COOKIE的,论坛地址:http://bbs.txwm.com/list.asp?boardid=43
以下是站点规则,测试任何一个页面都没有问题,但采集的时候只能采一条记录!
标题:
<title> </title>
内容:
<font color=red>[(*)]</font> ','200
排除:
<font color=#000066>[(*)]</font>
此主题相关图片如下:
','200(*)'))
<img src=Skins/Default/emot/(*).gif border=0 align=middle onmousewheel="return bbimg(this)" onload="javascript:if(this.width>screen.width-500)this.style.width=screen.width-500;">
<a href="(*)</font></a>
(*)','
[ 本帖最后由 netsky 于 2007-3-12 00:49 编辑 ] 对用cookie或session控制访问的网站你还是别想了;;;;;;;;;;
页:
[1]