吹雪丸 发表于 2007-6-22 07:39:25

[建议]增加空标题与空内容重采功能

在采集时发现采到好多空标题或者空内容的文章,规则无问题,单条测试采集完全可以采到。这个应该是与电脑配置和网速有关,把单个任务的线程数改为越小成功率越大,即线程数越大空标题与空内容的出现率越高。建议下个版本增加无法采到的空标题与空内容的文章可以重新采集!

吹雪丸 发表于 2007-6-22 08:26:33

刚才试了下,把空标题与空内容的文章页地址导出为TXT再导入火车作为0深度采集,经过7-8个回合才终于把全部的内容采回来了,唉!真麻烦!

水镜梵天 发表于 2007-8-3 14:10:36

这个功能的确相当重要。

sanny 发表于 2007-11-15 12:50:13

这个建议火车头怎么不采纳?
其实只要操作下数据库就可以了。

就像“标记内容发布状态为未发”一样,给个“标记标题为空的为未采集”,和“标记内容为空的为未采集”

因为网速问题总是漏采,很麻烦。

rq204 发表于 2007-11-15 13:10:19

现有的火车版本里有此功能.

sanny 发表于 2007-11-15 17:00:21

免费有有吗?说清楚点。在哪?

sanny 发表于 2007-11-17 11:30:56

哎,问题都不会解决,这论坛怎么会有人气呢?

流沙河 发表于 2007-11-18 22:02:04

原帖由 rq204 于 2007-11-15 13:10 发表 http://bbs.locoy.com/images/common/back.gif
现有的火车版本里有此功能.
在哪里,怎么操作?

ok160net 发表于 2007-11-22 08:43:04

现在的版本里本来就有这种功能,但就是有的页面不一样,肯定是采不到数据,但每次采集都会去采,这个也真够郁闷的,不知道是否有重试几次就不采的功能

lbjyuer 发表于 2016-2-10 10:53:18

爪,以后学习下。。
页: [1]
查看完整版本: [建议]增加空标题与空内容重采功能