火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: 火车头

2009测试版BUG提交专帖

[复制链接]
发表于 2009-2-12 12:22:49 | 显示全部楼层
本帖最后由 wendywang 于 2009-2-12 12:24 编辑

本地编辑采集数据时,编辑采集字段那里,数据都乱了,点标题显示的是内容,乱套了。

评分

1

查看全部评分

发表于 2009-2-12 13:33:03 | 显示全部楼层
本帖最后由 懷念過去↑文 于 2009-2-12 19:02 编辑
  1. 搜索 System/config.ini里 KeepAlive=True 改成 KeepAlive=False 看看

  2. --by 懷念過去↑文
复制代码

登录不上

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-2-12 19:10:35 | 显示全部楼层
发现个bug
将缩略图保存止后面选择路径的按钮看不到了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

1

查看全部评分

发表于 2009-2-12 19:20:50 | 显示全部楼层
另外发现个BUG
08 09 都有问题。
数据库选择为sqlite时
在第一步:采集网址规则
设置自定义链接格式,并选择下载缩略图到本地。
开始采集后,采集网址速度非常非常慢,切换到access数据库下,一切正常。
问题已经反应给尘缘了。希望可以早点解决
发表于 2009-2-12 20:49:21 | 显示全部楼层
发布慢多了,不知道什么原因!!!!!!!!
发表于 2009-2-12 22:09:04 | 显示全部楼层
多线程采集和发布出现问题
发表于 2009-2-13 08:49:23 | 显示全部楼层
本帖最后由 ahwcz 于 2009-2-13 08:55 编辑

采集的内容里的引号""都成了“”这种代码,导致对内容分词时,“”也成为了关键字。成这样:【SY_分词】: 印刷品|网站|莫奈|信息|艺术|雅虎|流量|意图|rdquo|ldquo|

例如对这个页的采集:http://www.admin5.com/article/20080729/96294.shtml
下面是采集的部分内容:
<p>  1、导航型搜索者 要寻找特定的网站(可能因为他们不知道确切的网址),使用的搜索请求如&ldquo;新浪&rdquo;或者&ldquo;网易&rdquo;。</p>
<p>  2、信息性搜索者 需要信息来回答他们的问题或者要了解新的主题,使用的搜索请求如&ldquo;什么是SEO&rdquo;或者&ldquo;网站优化&rdquo;。</p>
<p>  3、交易型搜索者 想要做些事情(买东西、注册、参加竞赛等),他们使用的搜索请求如&ldquo;悉尼天气&rdquo;或者&ldquo;NOKIA5200如何解锁&rdquo;</p>
发表于 2009-2-13 10:14:23 | 显示全部楼层
本帖最后由 wendywang 于 2009-2-13 10:16 编辑

插入的连接变成类似这样的了,<a href=\"http://www.sohu.com/\">sohu</a>
采集发布设置里面的循环时的合并间隔符也是,有html代码的都变成上面这样的了。内容规则里也一样。

还有一点,编辑采集数据时,点击表上面的字段,下面的表不能重新排列,2008可以的,希望可以添加以方便用户。

最后,那个多线程采集网址有问题,一直只能单线程采集网址。
发表于 2009-2-13 11:15:06 | 显示全部楼层
发现个较大的BUG
见图片,测试采集一个12个数据的相册列表,并设置下载缩略图

附件下载中也是12个附件正常下载

但在使用中发现个奇怪的问题,下载文件夹中有24个文件。
200921310181146606.jpg
200921310181146606(1).jpg
最大的问题是
200921310181146606.jpg 这个文件是坏的。无法浏览图片!



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-2-13 11:26:55 | 显示全部楼层

附上规则

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-10-3 13:25

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表