westmin 发表于 2012-3-5 10:45:54

采集网址一个bug,采集内容一个bug

采集到的网址,总数超过10000时,统计错误,会显示采集到19999个。
采集内容过程中,如果断网(如拔掉网线,关闭代理软件),会提示“成功采集并更新数据到数据库:http://***“,并标记为”已采集“,实际上无数据。

qqtoqq 发表于 2012-3-5 10:50:53

断网,就是连不上对方网站,但是采集器还是会抓取这些页面的,抓取了就会设置为已采集,你可以在规则里设置不得包含出现的标志字符串,路不得包含:没联网时,返回的字符串
页: [1]
查看完整版本: 采集网址一个bug,采集内容一个bug