深度多页面采集
循环多页设想现在的多页采集,是从网站默认页源码中,或默认地址获取多页的地址,再采集内容,
设想:是否可以更改现有的方式,让它从火车采集器中获取多页面的地址(从临时数据以及所有的标签结果中获取),这样应该能实现多层深度的多页采集功能
处理:1.提交默认页地址时,车头把默认页的源码保存到临时数据库中,
2.在标签中增加“隐藏”采集结果的功能。这样做即可以在多页采集的时候能够从“标签”结果中获取“多页地址”,又能使查看窗口简洁清楚。
我完全不懂编程,不会制作插件,虽然车头采集器功能很强大,但是现在的多页功能局限性很大,以上是个人愚见,期待官方能实现多层深度的多页采集功能,如果有能力的朋友能够制作出这类插件的也可以联系我,价钱另议QQ228996751 支持呀!!!!! 绝对支持,无人看管,多层采集 和你们一块学习。。。
页:
[1]