oldrmt 发表于 2010-3-25 16:40:39

原来火车真的无法深采集

火车头深层采集尚无前例只是火车头的目标,(有目标就好,我在期待中。。。。)
从我们伟大的版主证实sushy曾经在http://bbs.locoy.com/spider-22809-1-1.html说过:
1、深层采集。 目前火车头可以采集2级列表,但第2级如何使用,还无相关教程。也没有采集成功的案例(可能是我关注的太少)。

2.对于每1级别的采集都可以按照一定的规则修改其网页地址,如prar/3122.htm更换成price/3122.htm 或者页内采集。也就是楼主提及之功能。

3.对列表页面进行限制,防止无效采集,这就是一级页面下面用到的必须包含,不能包含和范围功能。

沦陷今生 发表于 2010-3-25 17:20:42

深度2的采集有很多很多了,主要注意 第二级的筛选条件即可。
也可以借用脚本,进行自定义多级深度的采集。

oldrmt 发表于 2010-3-25 17:39:56

那能不能发一个采集规则来给我参考?

oldrmt 发表于 2010-3-25 17:40:18

272326313@qq.com

oldrmt 发表于 2010-3-25 17:55:01

现在我正在从各种渠道在找解决此问题的方法;;
我曾向WILLIN求助,但是目前还没有得到有效的解决;;
您好,您在前几天回信中介绍了用火车头采集器采集,我通过这两天的摸索和学习,已经学会了它的采集规则,和解决了上次的分页的处理。但是我现在有一问题向您请教,就是如何实现深层采集?我在火车头论坛里找了好久都没有找到,能不能告诉入手的方法?敬请您的回答,谢谢!

沦陷今生 发表于 2010-3-25 18:11:45

好的,我贴一个简单规则你学习下吧,然后再次建议,多看教程,多看帮助,这是一个很基础的问题,并没有什么高深,再掘坟发此类贴,就不客气了。

axhchrw 发表于 2010-3-25 20:36:29

{:4_180:}{:4_180:}

oldrmt 发表于 2010-3-26 08:30:30

本帖最后由 oldrmt 于 2010-3-26 08:47 编辑

沦陷今生
非常感谢你的热心帮助,我也是不得以再出此下三烂的办法;

哥们,在您的演示里只有采集网址规则,这个我是会的
可是你的里面没有采集内容规则,采不下来;;

ghostscat 发表于 2010-3-26 10:17:30

深度2采集早就有了啊,楼上的,采集到网址就证明能采的,内容是你自己定的

oldrmt 发表于 2010-3-26 11:52:16

现在我感到迷糊的是采集内容设置的时,内容设置要么设定在列表页,那就采集不到内容页。要么设置采集内容页,那就出现采集不到列表页。
此问题何解?
页: [1] 2
查看完整版本: 原来火车真的无法深采集