【求助】关于分页采集的问题
本帖最后由 xiaoluo18 于 2015-4-10 14:09 编辑如题
比如,有一个页面1,内容为:标题1,图片1、标题2,图片2;标题1连接页面2,页面2的的内容为:内容1
标题1和图片1的规则是“该标签循环匹配”,然后内容1的规则是“该标签循环匹配”和“该标签在分页中匹配”,最终测试结果如下:
███████████████第1条记录████████████████
【标题】:标题1
【展示图】:图片1
【内容】:
███████████████第2条记录████████████████
【标题】:标题2
【展示图】:图片2
【内容】:内容1
请问该如何将内容1合并到第一条记录中呢?
我尝试勾选“循环不足的记录以第一条记录不全”还是不行,请教各位该如何处理呢?
对了,我用的是8.5免费版的采集器。
:(:(:( 如何没理解错,这个没办法处理,可以说是个bug,采集分页的时候,默认页也会采集。比如说,默认页-分页1-分页2,程序就会采集为:默认页内容1(一般就是空内容),分页内容1,分页内容2,这样组合的时候就会第一条是空内容。 路过帮顶,高手解答 那应该是内容规则截取范围不准确 303718 发表于 2015-4-10 17:08
那应该是内容规则截取范围不准确
大大你好,能详细讲解一下吗?
比较奇怪的是我随便找了个网站测试结果都一样...
我的理解是,页面2相当于是页面1的分页,那么在页面2采集的数据不应该是关联到页面1第一条采集到的结果中吗? 嗯额恩。我帮顶把!不好回答 同问。求高手回答!! 路过帮顶,高手解答 飘过帮顶,楼下解答!! 不知道。我不知道 帮你顶!希望你能找到答案