发新话题
打印

2.0的建议

2.0的建议

建议,任务列表应该改为下载软件如迅雷、快车那种的模式,已经下载的就应该到已下载列表里去。下次采集就应该不去处理以采集的网址。

目前版本如果采集很多,一次采集不完,程序第二次开始又去采集已经采集的网址,等入库才发现已经采集,提示采集失败,浪费资源和时间。

TOP

赞一个,但可能不考虑这种方式

一个任务采集完后其配置下次还有用

可以用来监视网站的动态更新

对比一下网址就可以决定只对增量网址进行采集

TOP

对 这个功能有用 好

TOP

耶!!!!!!太好了,可以避免重复采集了!!!!!!

TOP

对了,希望2.0能解决标题中+,#等符号丢失的问题。呵呵,辛苦了哟!

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.213813 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-22 21:52 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档