xiaocai205 发表于 2008-1-16 10:18:36

采集过程建议。。。

1.采集过程中支持断点续传
2.可以停止任务然后关机后下次可以接着采集
3.采集中可以选择暂停任务然后导库,发布到数据库后接着采集
4.关于(*)。。例如http://www.sina.com/(*)/(*)/(*)火车头的采集是http://www.sina.com/2/2/2,http://www.sina.com/3/3/3,http://www.sina.com/4/4/4,http://www.sina.com/5/5/5]http://www.sina.com/1/1/1,http://www.sina.com/2/2/2,http://www.sina.com/3/3/3,http://www.sina.com/4/4/4,http://www.sina.com/5/5/5,可不可以是http://www.sina.com/1/1/1,http://www.sina.com/1/1/2 ,http://www.sina.com/1/1/3,http://www.sina.com/1/1/(*)这样做呢?

飛越無限 发表于 2008-1-16 10:27:03

sp4加了一个排除重复超过多少人重复的就自动下一步操作

lbjyuer 发表于 2016-2-10 09:38:16

爪,以后学习下。。
页: [1]
查看完整版本: 采集过程建议。。。