chenbizhu 发表于 2010-8-30 13:40:24

我采集一个图片论坛,但是只采集到最后一页,导致都是文字没图片

采集不到第一页,该怎么设置?

lxy2010 发表于 2010-8-30 14:54:43

针对你采集不到第一页的解决方法:
可能是从第二页起网址在第一页的基础上有个页数的变化,单独把第一页的网址放在采集器里,进行规则设置并进行采集即可。

chenbizhu 发表于 2010-8-30 15:19:02

不大懂,我的理解如下:

我采集的页面是“论坛主题列表”,如果将“内容页”的第1页的网址放采集器里,那只能采集一次。

因为更新的是主题列表。

lxy2010 发表于 2010-8-30 15:58:20

比如采集我们官方的论坛来举例,你采集主题列表就是采集列表页,如http://bbs.locoy.com/netget-21-1.html抓取这个页面的网址。抓取的网站有52页的页数,你如果都抓取下来,只需要在采集器里写上http://bbs.locoy.com/netget-21-(*).html即可。前提是第一页的页数规律是和后面的页数一样的,都是按照数字往后递增或者递减的页数。采集不到第一页可以在采集器的同一个规则里另外添加第一页的单条网址。如果还不明白,可以联系我们的在线客服,或者申请培训。
页: [1]
查看完整版本: 我采集一个图片论坛,但是只采集到最后一页,导致都是文字没图片