[建议]增加空标题与空内容重采功能
在采集时发现采到好多空标题或者空内容的文章,规则无问题,单条测试采集完全可以采到。这个应该是与电脑配置和网速有关,把单个任务的线程数改为越小成功率越大,即线程数越大空标题与空内容的出现率越高。建议下个版本增加无法采到的空标题与空内容的文章可以重新采集! 刚才试了下,把空标题与空内容的文章页地址导出为TXT再导入火车作为0深度采集,经过7-8个回合才终于把全部的内容采回来了,唉!真麻烦! 这个功能的确相当重要。 这个建议火车头怎么不采纳?其实只要操作下数据库就可以了。
就像“标记内容发布状态为未发”一样,给个“标记标题为空的为未采集”,和“标记内容为空的为未采集”
因为网速问题总是漏采,很麻烦。 现有的火车版本里有此功能. 免费有有吗?说清楚点。在哪? 哎,问题都不会解决,这论坛怎么会有人气呢? 原帖由 rq204 于 2007-11-15 13:10 发表 http://bbs.locoy.com/images/common/back.gif
现有的火车版本里有此功能.
在哪里,怎么操作? 现在的版本里本来就有这种功能,但就是有的页面不一样,肯定是采不到数据,但每次采集都会去采,这个也真够郁闷的,不知道是否有重试几次就不采的功能 爪,以后学习下。。
页:
[1]