iespy 发表于 2009-5-22 15:26:10

无法完成JSON ==> 可能目标网站编码已经改变

本帖最后由 iespy 于 2009-5-23 17:20 编辑

用了2009火车,在采集时,目标网页编码是uft-8 于是采集指定编码 uft-8
发布使用的是发布到数据库的模块,所以发布不存在编码问题.
测试采集所有标签正常,只有到尾部出现以下提示
无法完成JSON ==> JavaScriptConvert.DeserializeObject的转换,可能目标网站编码已经改变

标题确认已经采集到,因为上面有对标题处理的标签,关键字和转换拼音都是使用标题标签

没有理会他,采集时发布到数据库时也提示这个错误

请高手帮忙看看我遇到了什么问题

rq204 发表于 2009-5-22 15:47:06

你用的dll接口吧,看一下你程序哪里出错了.

iespy 发表于 2009-5-22 17:30:06

本帖最后由 iespy 于 2009-5-22 17:33 编辑

首先感谢管理员的回复,对我的帮助很大,现在可以排除是DLL接口的问题
我改了一下发布方式,改成WEB发布模块
以下是我的测试结果:
测试采集规则:
测试时发现依旧是标题处提示错误,但其他标签根据标题处理的标签没有问题
第一个拼音就是根据标题处理的

测试发布模块:
测试时没有任何问题

测试整个任务采集:
提示如图


这里也显示了这个错误,并且采集到数据标题里带有这个错误描述


为了更好的解释我的问题,我把目标页和我的规则也发出来

http://ms.nvq.net.cn/nvqdbApp/htm/zhengcefagui/ecFwPreview-1392.html

规则:
开始-->
<tr>
            <td width="72" nowrap>发文标题</td>
            <td width="676" colspan="3">
结束-->
            </tr>

iespy 发表于 2009-5-22 17:36:08

本帖最后由 iespy 于 2009-5-22 17:46 编辑

补充:
      刚刚修改了标题的规则,让标题标签固定为一个值"111111"
但测试采集数据与上面测试采集规则的图一样,依然显示 错误描述

weblog的记录是空的!
页: [1]
查看完整版本: 无法完成JSON ==> 可能目标网站编码已经改变