发新话题
打印

[建议]增加空标题与空内容重采功能

[建议]增加空标题与空内容重采功能

在采集时发现采到好多空标题或者空内容的文章,规则无问题,单条测试采集完全可以采到。这个应该是与电脑配置和网速有关,把单个任务的线程数改为越小成功率越大,即线程数越大空标题与空内容的出现率越高。建议下个版本增加无法采到的空标题与空内容的文章可以重新采集!

TOP

刚才试了下,把空标题与空内容的文章页地址导出为TXT再导入火车作为0深度采集,经过7-8个回合才终于把全部的内容采回来了,唉!真麻烦!

TOP

这个功能的确相当重要。

TOP

这个建议火车头怎么不采纳?
其实只要操作下数据库就可以了。

就像“标记内容发布状态为未发”一样,给个“标记标题为空的为未采集”,和“标记内容为空的为未采集”

因为网速问题总是漏采,很麻烦。

TOP

现有的火车版本里有此功能.

TOP

免费有有吗?说清楚点。在哪?

TOP

哎,问题都不会解决,这论坛怎么会有人气呢?

TOP

引用:
原帖由 rq204 于 2007-11-15 13:10 发表
现有的火车版本里有此功能.
在哪里,怎么操作?

TOP

现在的版本里本来就有这种功能,但就是有的页面不一样,肯定是采不到数据,但每次采集都会去采,这个也真够郁闷的,不知道是否有重试几次就不采的功能

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.178400 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-9-8 06:31 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档