4126 发表于 2010-7-22 12:53:11

老问题分页采集的问题

一直被这个问题困惑,我分析下原因

比如我要采集页面
http://www.xxxxx.com

下面有很多分页
http://www.xxxxx.com/1.html
http://www.xxxxx.com/2.html

http://www.xxxxx.com/100.html
利用分页采集,默认分页会变成
1:http://www.xxxxx.com
2:http://www.xxxxx.com/1.html
3:http://www.xxxxx.com/2.html

第1条内容我并不想要,但是默认就是,怎么能取消掉呢?
我的采集分页代码页是设置了的。
----------------------------------------------------------------------------
就算第1条内容是空内容,但是我需要每条内容都换行,这样就会导致第1条内容是一个空行,很多程序会出错。

qianglong 发表于 2010-7-22 20:51:47

用 手动填写地址连接规则

4126 发表于 2010-7-24 15:55:21

用 手动填写地址连接规则
qianglong 发表于 2010-7-22 20:51 http://bbs.locoy.com/images/common/back.gif

第1条还是默认显示采集页
这个作用不大,只是对特定的CMS好用

9o8i7u 发表于 2010-7-25 21:31:54

手动
http://www.xxxxx.com/[参数].html
链接
http://www.xxxxx.com/[参数1].html
页: [1]
查看完整版本: 老问题分页采集的问题