今天有幸体验了下企业版的百万级模式,有感!!
第一个感觉:爽.....虽然自己只采集了1W的数据,采用的是文本导入地址库,5s就把所有地址导进去了,不想免费版,那么慢啊......
第二个感觉:还是爽...
采集及发布,采集一个发布一个,,,,不再是全全采集回来在发布了.... 真的是很神速........
第三个感觉:不爽....
运行了一会,突然死掉,重新打开执行,发现问题了.....地址库能检查到已经导入,但是内容页全部都是未采集状态, 所有数据都是全部重新采集......... 看到这个结果很不爽......如果真的采集百万级数据,要是遇上中途死机,那就麻烦大了.......
于是乎,俺就想,既然可以检查地址库的已存在,为什么不能通过这个地址库来判断已采集过了呢.... 这样就不会出现死机而全部重新采集的问题了........
希望官方考虑下...... 虽然很少有机会会用到这个功能....... 本帖最后由 大腿 于 2009-12-26 20:46 编辑
我这个建议 http://bbs.locoy.com/spider-46616-1-1.html 就是为了对付"突然死掉"/"意外关闭".你说没必要....
买"企业版"不如买"标准版". 这个是没有考虑到,要加上. 第二个感觉:还是爽...
采集及发布,采集一个发布一个,,,,不再是全全采集回来在发布了.... 真的是很神速........
===========================================
不成熟的功能.爽毛. 是的,这是个很严重的BUG,2010版如果不改进的话就太失望了!!!!! 原来“重复检测”的问题是火车头死掉或自动退出产生的!
cao,我的经常自动退出,导致每次采集都提示已经采集过,是重复网址!!!
MBD 支持火车。。。。历史帖子回顾中。
页:
[1]