火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 9985|回复: 37

【求助】关于分页采集的问题

[复制链接]
发表于 2015-4-10 14:02:29 | 显示全部楼层 |阅读模式
本帖最后由 xiaoluo18 于 2015-4-10 14:09 编辑

如题

比如,有一个页面1,内容为:标题1,图片1、标题2,图片2;标题1连接页面2,页面2的的内容为:内容1
标题1和图片1的规则是“该标签循环匹配”,然后内容1的规则是“该标签循环匹配”和“该标签在分页中匹配”,最终测试结果如下:

███████████████第1条记录████████████████
【标题】:标题1
【展示图】:图片1
【内容】:
███████████████第2条记录████████████████
【标题】:标题2
【展示图】:图片2
【内容】:内容1

请问该如何将内容1合并到第一条记录中呢?

我尝试勾选“循环不足的记录以第一条记录不全”还是不行,请教各位该如何处理呢?

对了,我用的是8.5免费版的采集器。

发表于 2015-4-14 11:45:21 | 显示全部楼层
如何没理解错,这个没办法处理,可以说是个bug,采集分页的时候,默认页也会采集。比如说,默认页-分页1-分页2,程序就会采集为:默认页内容1(一般就是空内容),分页内容1,分页内容2,这样组合的时候就会第一条是空内容。
发表于 2015-4-10 15:46:21 | 显示全部楼层
路过帮顶,高手解答
发表于 2015-4-10 17:08:12 | 显示全部楼层
那应该是内容规则截取范围不准确
 楼主| 发表于 2015-4-10 18:56:44 | 显示全部楼层
303718 发表于 2015-4-10 17:08
那应该是内容规则截取范围不准确

大大你好,能详细讲解一下吗?
比较奇怪的是我随便找了个网站测试结果都一样...
我的理解是,页面2相当于是页面1的分页,那么在页面2采集的数据不应该是关联到页面1第一条采集到的结果中吗?
发表于 2015-4-10 22:21:59 | 显示全部楼层
嗯额恩。我帮顶把!不好回答
发表于 2015-4-11 04:49:21 | 显示全部楼层
同问。求高手回答!!
发表于 2015-4-11 07:15:26 | 显示全部楼层
路过帮顶,高手解答
发表于 2015-4-11 08:14:53 | 显示全部楼层
飘过帮顶,楼下解答!!
发表于 2015-4-11 13:55:49 | 显示全部楼层
不知道。我不知道
发表于 2015-4-11 16:47:58 | 显示全部楼层
帮你顶!希望你能找到答案
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 03:33

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表