火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2591|回复: 7

求助为何发不成功?

[复制链接]
发表于 2008-10-2 17:57:53 | 显示全部楼层 |阅读模式
我是新手,不是很会用,看着教程试着做,测试采集和测试发布是成功的,但采集和发布没发成功,请指导一下:流程:
我也不知按什么顺序发图。

[ 本帖最后由 koo 于 2008-10-2 18:18 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-10-2 18:03:28 | 显示全部楼层
就是没看见发的内容在哪,也就是不成功!
发表于 2008-10-2 20:23:44 | 显示全部楼层
你都把那个最重要最重要的提示都没有贴出来,而把一些用处不是很大的给贴出来,谁能帮你啊
发表于 2008-10-2 20:37:34 | 显示全部楼层
规则错,标题为空.
 楼主| 发表于 2008-10-2 20:49:45 | 显示全部楼层
原帖由 chenfy 于 2008-10-2 20:23 发表
你都把那个最重要最重要的提示都没有贴出来,而把一些用处不是很大的给贴出来,谁能帮你啊

不好意思,我不明白是那个提示。我也想贴出啊。因为才学,不很明白。可否说明白点我贴出来看看。
 楼主| 发表于 2008-10-2 20:52:55 | 显示全部楼层
原帖由 winslow 于 2008-10-2 20:37 发表
规则错,标题为空.

我这是试着采一篇文章,测试文章是采到了,不知还有哪里规则是错的?哪个标题为空是不用写吗?不好意思,刚学,问得有点幼稚。
发表于 2008-10-3 14:23:53 | 显示全部楼层
给楼主提个建议:

1. 采集部分

你要采集的是 1121M.htm这个网址,测试的时候也是测试的这个网址,那你应该在 采集网址深度那里填写 0 级,而不是 1级。0级表示采集本页(将本页作为内容页),而1级表示将本页作为列表页,采集该页中所有符合规则的链接的指向的页面。

从  2008-10-02_17-42-45.jpg (103.76 KB)  图中,你可以看到你其实采集的都是1121M.HTM 页包含的网址中 的那些页面,而不是 1121M.HTM本身,这不是你的真实目的,也不符合采集内容规则,当然不能入库了。

正确的顺序应该是,

你在填写好采网址规则以后,点击“开始测试网址采集”,

出来的网址列表中选择一个网址进行采集内容测试。

而不是直接拿这个“开始采集地址”直接进行 采集页面内容 分析。



2. 发内容这块,你可以看  2008-10-02_18-16-58.jpg (81.83 KB)  这个图中的说明

错误的提示你 content was too short, 这说明你网站认为你提交的 content 字段内容太短。为什么会造成这个结果呢?

因为你在采网址中采了很多和你采集规则不符的网址,这样采集到本地数据库中的 内容 字段就是 空值,什么也没有,那么发布提交该字段,也肯定是空值,网站当然会给你返回 content was too short 了。

那你说,为什么我测试的时候可以发布呢?原因很简单,测试的时候,你可以看 2008-10-02_17-49-05.jpg (92.43 KB)  图, 内容  字段 是你添加上的,而不是从本地数据库中取出的值,他是有值的,所以就发布成功了。

向你啰嗦了这么多,用一句总结:就是测试的时候是人工给 内容 字段赋值,而实际发布的时候,是数据库向 内容 字段赋值。由于数据库中什么都没采到,那么提交出来的就是content was too short 了。

评分

1

查看全部评分

 楼主| 发表于 2008-10-4 16:37:15 | 显示全部楼层
原帖由 sushy 于 2008-10-3 14:23 发表
给楼主提个建议:

1. 采集部分

你要采集的是 1121M.htm这个网址,测试的时候也是测试的这个网址,那你应该在 采集网址深度那里填写 0 级,而不是 1级。0级表示采集本页(将本页作为内容页),而1级表示将本页作 ...

非常感谢版主的分析指点,我在用别人的规则和你给的分析,终于弄明白了,也采集成功和发布成功了,多谢了。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-23 11:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表