火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4333|回复: 2

抓取网页数据工具如何单独进行发布操作

[复制链接]
发表于 2016-4-20 13:13:28 | 显示全部楼层 |阅读模式
抓取网页数据工具火车采集器V9是市场中功能最全面的采集软件,具备数据采集、处理和发布功能,能够轻松应对网站更新维护、内容群发等需求。采集完发布大家一定都会操作了,但是如果你已经有了一批数据,不需要再进行采集,只需要发布该怎么通过火车采集器来实现呢?

  其实这个需求也是很容易实现的,大家可以按照以下步骤来进行:

1、首先是新建一个任务,这步操作会产生一个任务数据库,然后将自己已有的数据导入到这个数据库中。当然,这个任务你需要设置发布步骤,否则无法实现发布。

2、在任务数据库中,将已采设置为true或1,mysql,sqlserver是1。

3、开始运行任务,在火车采集器最新版V9里面不需要勾选采集,在其他版本中不需要勾选采网址和采内容,只勾选发内容即可。

  有的用户反映说,抓取网页数据工具火车采集器会重复发布文章,也就是说发布到网站后,下一次运行时又接着发布,导致网站上内容重复。对于这个问题,我们需要从以下两点着手考虑:

1、采集器是否采集了多篇一样的文章内容? 可以通过,右击规则——本地编辑数据来查看采集的数据。

2、采集器发布的时候,是否提示了发布成功?  如果您发布的时候提示的是 “发布未知” 或者“发布失败”  ,而实际上您的内容确实是已经成功发布到您的网站了。那么这个状态下,采集器不会把内容标记为已发状态,下次发布的时候,还是会作为新内容去发布的。所以才会出现部分用户看到的重复发布的问题。

  针对上面的问题,解决方案如下:

1、如果是发布的内容有的显示成功,有的显示未知,那么考虑调整下发布时间间隔,间隔设置长一些,然后再运行发布试试,关于如何设置线程可参考官网教程。

2、如果上面方法仍然解决不了问题,那么可以考虑强制解决办法,在文件保存及部分高级设置的右下角发布结束后,勾选标记所有记录为已发,这样每次发布无论发布结果如何提示,都会把这条记录标识为已经发布。

  抓取网页数据工具火车采集器V9对于采集、处理、发布均能进行高效的操作,学会灵活运用能够为我们的日常工作和学习带来极大的便利。



头像被屏蔽
发表于 2016-6-27 16:07:22 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
头像被屏蔽
发表于 2016-6-27 17:02:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-7 15:53

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表