火车采集器软件交流官方论坛's Archiver
论坛
›
BUG报告
› 采集网址一个bug,采集内容一个bug
westmin
发表于 2012-3-5 10:45:54
采集网址一个bug,采集内容一个bug
采集到的网址,总数超过10000时,统计错误,会显示采集到19999个。
采集内容过程中,如果断网(如拔掉网线,关闭代理软件),会提示“成功采集并更新数据到数据库:http://***“,并标记为”已采集“,实际上无数据。
qqtoqq
发表于 2012-3-5 10:50:53
断网,就是连不上对方网站,但是采集器还是会抓取这些页面的,抓取了就会设置为已采集,你可以在规则里设置不得包含出现的标志字符串,路不得包含:没联网时,返回的字符串
页:
[1]
查看完整版本:
采集网址一个bug,采集内容一个bug