火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4918|回复: 8

完美解决内容重复发布的方法(个人独创)

[复制链接]
发表于 2009-1-4 01:05:10 | 显示全部楼层 |阅读模式
本帖最后由 ps94506 于 2009-1-4 01:07 编辑

在上次发的一个“完美解决html代码暴露在贴子中方法”

地址http://bbs.locoy.com/spider-34048-1-2.html

大受好评,解决了不少因html代码引起的问题

今天再发一个重量级的方法教程

此方法仅适用于因发布标识未知而引起的内容重复发布

为什么内容重复发布?

因为内容发布了2次或多次

为什么会这样呢,因为内容第一次发布后,未能正确将内容设成“已发”(收费版的用户可以本地编辑任务采集数据来查看到)

为什么无法正确设置?

因为发布标识未知,系统无法根据返回标识来设置

为了找到答案,确实花了不少脑子的,头都想痛了,管理员要多加分鼓励呀,

造成发布标识未知的原因很多,我也不得而知了




既然因为发布标识未知引起的,那我让它发布标识成功返回就可以了

教程开始登场



1,在任务列表中 > 编辑任务  > 发布内容设置  > 这时你应该已经正确设置了其中的“方法一:Web在线发布到网站”


2,看到“方法二:保存为本地文件”,勾选“启用”,再设置“保存位置”和“html模板”

3,点到“文件保存及运行时设置”标签,找到“成功发布到哪定义为发布为成功”,选“二,保存为本地文件”

4,更新后退出



方法思路:WEB在线发布,发布正确,但无法获得成功标识,而利用本地发布,成功获得成功标识,系统就能正确标识发布过的内容为“已发布”的了

注:本地保存的文件,过后删除即可

此问题解决后,无人值守采集变得真实可行

谢谢观看,加分加分
发表于 2009-1-4 01:36:10 | 显示全部楼层
支持楼主的精神

如果是这样的话,那还不如设置成功标识码为空

怎么发,怎么成功
 楼主| 发表于 2009-1-4 01:53:10 | 显示全部楼层
支持楼主的精神

如果是这样的话,那还不如设置成功标识码为空

怎么发,怎么成功
xiongyujie37 发表于 2009-1-4 01:36


如果是这样的话,那真是太好了。
发表于 2009-1-4 14:59:48 | 显示全部楼层
我只看懂了最后一句,郁闷~~
发表于 2009-1-11 15:26:22 | 显示全部楼层
还是有点帮助的。
发表于 2009-1-11 21:29:11 | 显示全部楼层
如果确认你的模块post数据过程没问题,那设置成功标识码为html就好了!
发表于 2009-3-14 23:57:31 | 显示全部楼层
很好用,谢谢!
发表于 2009-3-15 09:44:27 | 显示全部楼层
有几句还是不明白!
发表于 2009-3-23 13:07:39 | 显示全部楼层
这样工作量就加大了啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-10-6 18:04

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表