火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3395|回复: 3

无法完成JSON ==> 可能目标网站编码已经改变

[复制链接]
发表于 2009-5-22 15:26:10 | 显示全部楼层 |阅读模式
本帖最后由 iespy 于 2009-5-23 17:20 编辑

用了2009火车,在采集时,目标网页编码是uft-8 于是采集指定编码 uft-8
发布使用的是发布到数据库的模块,所以发布不存在编码问题.
测试采集所有标签正常,只有到尾部出现以下提示
无法完成JSON ==> JavaScriptConvert.DeserializeObject的转换,可能目标网站编码已经改变

标题确认已经采集到,因为上面有对标题处理的标签,关键字和转换拼音都是使用标题标签

没有理会他,采集时发布到数据库时也提示这个错误

请高手帮忙看看我遇到了什么问题

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-5-22 15:47:06 | 显示全部楼层
你用的dll接口吧,看一下你程序哪里出错了.
 楼主| 发表于 2009-5-22 17:30:06 | 显示全部楼层
本帖最后由 iespy 于 2009-5-22 17:33 编辑

首先感谢管理员的回复,对我的帮助很大,现在可以排除是DLL接口的问题
我改了一下发布方式,改成WEB发布模块
以下是我的测试结果:
测试采集规则:
测试时发现依旧是标题处提示错误,但其他标签根据标题处理的标签没有问题
第一个拼音就是根据标题处理的

测试发布模块:
测试时没有任何问题

测试整个任务采集:
提示如图


这里也显示了这个错误,并且采集到数据标题里带有这个错误描述


为了更好的解释我的问题,我把目标页和我的规则也发出来

http://ms.nvq.net.cn/nvqdbApp/htm/zhengcefagui/ecFwPreview-1392.html

规则:
开始-->
<tr>
              <td width="72" nowrap>发文标题</td>
              <td width="676" colspan="3">

结束-->
              </tr>

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2009-5-22 17:36:08 | 显示全部楼层
本帖最后由 iespy 于 2009-5-22 17:46 编辑

补充:
        刚刚修改了标题的规则,让标题标签固定为一个值"111111"
但测试采集数据与上面测试采集规则的图一样,依然显示 错误描述

weblog的记录是空的!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-30 03:59

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表