28xl 发表于 2015-8-9 08:29:16

恳请增加一个功能选项:数据全部采集成功后才发布

本帖最后由 28xl 于 2015-8-9 08:34 编辑



经常遇到要完整数据的,比如小说第1章----100章,视频第一课----第30课,长文章的之一----之二十,电影集数等等,这些的第1章----100章,第一课----第30课,之一----之二十等等这些是需要完整不间断连续的,但是由于网络服务器等等可能原因有时不能让这些数据全部一气呵成,如采集中操作超时(但此网址能正常打开,复制此网址在测试采集又正常,就是自动运行中有时会操作超时,不是所有网址都这样,大部分没问题,个别有问题,而且问题是断断续续的)。比如:100集只采了99集,其中中间的一集未采到,这样火车自动发布了99集,当然火车第二次运行时没有采到的它会再次采集(已采集的不会再次采集),但是这样问题来了,这1集的排序落后很多不能和原发的99集构成连续的数据......

恳请官方在V9新版增加一个功能选项:所有数据全部采集成功后才发布内容。这样在自动运行中和计划执行中若数据采集不完整则不发布,等第二次补采完整后才开始发布。以确保排序连续,数据完整

303718 发表于 2015-8-10 08:03:19

你先不要勾选发布那个项目然后采完再发应该一样的呢

28xl 发表于 2015-8-10 09:37:18

303718 发表于 2015-8-10 08:03
你先不要勾选发布那个项目然后采完再发应该一样的呢

你那手动一次可以,但用火车是长期的啊,请官方加上这个选项,自动更新运行中和计划执行中使用

天性 发表于 2015-8-10 12:04:31

就算增加你说的这个选项,对LZ的最终结果也不会有多大改善。

对于这个问题,还是要增加对采集不成功的单条内容进行多次重试采集。这个我在好久之前就提出来了解决办法,但官方根本不管………………

【v8.5版本】建议增加重复采集功能。(发表于 2015-2-12 16:15:14 )
http://bbs.locoy.com/spider-139093-1-1.html



另外,对于序列采集的后续更新还有个问题,也找了个临时解决办法,但同样的官方根本不理:

【v8.5版本】建议增加倒序采集功能。(发表于 2015-2-16 18:13:10)
http://bbs.locoy.com/spider-139118-1-1.html






另,论坛直接搜索括弧内关键词(【v8),可以找到我的很多反映和建议,基本完全被忽略了……:(

28xl 发表于 2015-8-10 14:57:24

官方增加这个:所有数据全部采集成功后才发布内容,这个应该不难吧。

回4楼:可以改善的,在计划任务中多次运行换个时间能补全完整数据的

tomsjeef 发表于 2015-8-19 11:47:10

楼上加好友。。

lbjyuer 发表于 2016-2-10 23:02:41

支持火车。。。。历史帖子回顾中。
页: [1]
查看完整版本: 恳请增加一个功能选项:数据全部采集成功后才发布