被她的香水诱 发表于 2011-6-9 07:18:04

深度多页面采集

循环多页设想

现在的多页采集,是从网站默认页源码中,或默认地址获取多页的地址,再采集内容,

设想:是否可以更改现有的方式,让它从火车采集器中获取多页面的地址(从临时数据以及所有的标签结果中获取),这样应该能实现多层深度的多页采集功能

处理:1.提交默认页地址时,车头把默认页的源码保存到临时数据库中,
      2.在标签中增加“隐藏”采集结果的功能。这样做即可以在多页采集的时候能够从“标签”结果中获取“多页地址”,又能使查看窗口简洁清楚。


   我完全不懂编程,不会制作插件,虽然车头采集器功能很强大,但是现在的多页功能局限性很大,以上是个人愚见,期待官方能实现多层深度的多页采集功能,如果有能力的朋友能够制作出这类插件的也可以联系我,价钱另议QQ228996751

rogermmg 发表于 2011-6-16 11:56:44

支持呀!!!!!

心的方向 发表于 2011-6-22 17:48:10

绝对支持,无人看管,多层采集

lbjyuer 发表于 2016-2-8 17:14:08

和你们一块学习。。。
页: [1]
查看完整版本: 深度多页面采集