都市乞丐 发表于 2009-12-26 20:36:55

今天有幸体验了下企业版的百万级模式,有感!!

第一个感觉:爽.....

虽然自己只采集了1W的数据,采用的是文本导入地址库,5s就把所有地址导进去了,不想免费版,那么慢啊......

第二个感觉:还是爽...

采集及发布,采集一个发布一个,,,,不再是全全采集回来在发布了.... 真的是很神速........

第三个感觉:不爽....

运行了一会,突然死掉,重新打开执行,发现问题了.....地址库能检查到已经导入,但是内容页全部都是未采集状态, 所有数据都是全部重新采集.........    看到这个结果很不爽......如果真的采集百万级数据,要是遇上中途死机,那就麻烦大了.......

于是乎,俺就想,既然可以检查地址库的已存在,为什么不能通过这个地址库来判断已采集过了呢.... 这样就不会出现死机而全部重新采集的问题了........

希望官方考虑下...... 虽然很少有机会会用到这个功能.......

大腿 发表于 2009-12-26 20:45:15

本帖最后由 大腿 于 2009-12-26 20:46 编辑

我这个建议 http://bbs.locoy.com/spider-46616-1-1.html 就是为了对付"突然死掉"/"意外关闭".你说没必要....

买"企业版"不如买"标准版".

rq204 发表于 2009-12-26 20:55:36

这个是没有考虑到,要加上.

大腿 发表于 2009-12-26 21:10:11

第二个感觉:还是爽...
采集及发布,采集一个发布一个,,,,不再是全全采集回来在发布了.... 真的是很神速........
===========================================
不成熟的功能.爽毛.

被她的香水诱 发表于 2010-2-6 22:50:34

是的,这是个很严重的BUG,2010版如果不改进的话就太失望了!!!!!

luring 发表于 2010-2-7 03:49:43

原来“重复检测”的问题是火车头死掉或自动退出产生的!
cao,我的经常自动退出,导致每次采集都提示已经采集过,是重复网址!!!
MBD

lbjyuer 发表于 2016-2-9 01:03:14

支持火车。。。。历史帖子回顾中。
页: [1]
查看完整版本: 今天有幸体验了下企业版的百万级模式,有感!!