发新话题
打印

[3.2版] 采集过程建议。。。

采集过程建议。。。

1.采集过程中支持断点续传
2.可以停止任务然后关机后下次可以接着采集
3.采集中可以选择暂停任务然后导库,发布到数据库后接着采集
4.关于(*)。。例如http://www.sina.com/(*)/(*)/(*)火车头的采集是[url=http://www.sina.com/1/1/1,http://www.sina.com/2/2/2,http://www.sina.com/3/3/3,http://www.sina.com/4/4/4,http://www.sina.com/5/5/5]http://www.sina.com/1/1/1,http://www.sina.com/2/2/2,http://www.sina.com/3/3/3,http://www.sina.com/4/4/4,http://www.sina.com/5/5/5[/url],可不可以是http://www.sina.com/1/1/1http://www.sina.com/1/1/2http://www.sina.com/1/1/3http://www.sina.com/1/1/(*)这样做呢?

TOP

sp4加了一个排除重复超过多少人重复的就自动下一步操作
火车头商业版购买与咨询、火车高难度采集、全站采集入库服务、采集规则定制、web在线发布、入库模块定制等业务、大家多多支持呀!联系QQ:86020004
┏┄┄┄┄站长交流中心┄┄┄┄┓
┇ 欢迎大家加入以下群,此群组主要为各位从事计算机爱好者服务欢迎各位高手加盟共同学习QQ群號:7830012  4671518┇

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.119573 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-7 07:14 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档