peiyan 发表于 2008-9-12 04:02:34

求助用火车头2008版采集这个网站?

采集一个论坛下面的栏目数据 http://bbs.teawang.cn/forumdisplay.php?fid=2 碰到难题,测试地址采集,定义10个页面,结果测试网址采集返回的结果是:链接的二级页面的数据全是一样的,而且不是原先指定的那个栏目,即分析出来的网页地址对应的不是真实的地址,该站用discuz 6.0搭建,可以肯定是采用了防采集措施,我先后用过cookie登陆,参数规则等方法,在论坛上翻了n多个帖子,终究没有解决,所以求助大家帮支个招,谢谢!

下图是测试地址的采集图:

[ 本帖最后由 peiyan 于 2008-9-13 18:03 编辑 ]

peiyan 发表于 2008-9-12 04:17:02

再来张清晰的图:测试链接的二级页面的数据全是一样的。



[ 本帖最后由 peiyan 于 2008-9-12 04:19 编辑 ]

soarb 发表于 2008-9-12 06:57:36

楼主是用什么版本?
用2007版试下

chenfy 发表于 2008-9-12 07:05:17

这个是你的技术问题。设置方法看图

xyz5200 发表于 2008-9-12 07:58:04

YES。。这样就完全无错了。

说给自己听 发表于 2008-9-12 08:41:37

呵呵,网址分析好做,只要内容不加乱码就没问题。

peiyan 发表于 2008-9-13 17:56:42

多谢斑竹的指点,参数规则设好了,问题就迎刃而解了。
祝大家中秋快乐!
页: [1]
查看完整版本: 求助用火车头2008版采集这个网站?