无法完成JSON ==> 可能目标网站编码已经改变
本帖最后由 iespy 于 2009-5-23 17:20 编辑用了2009火车,在采集时,目标网页编码是uft-8 于是采集指定编码 uft-8
发布使用的是发布到数据库的模块,所以发布不存在编码问题.
测试采集所有标签正常,只有到尾部出现以下提示
无法完成JSON ==> JavaScriptConvert.DeserializeObject的转换,可能目标网站编码已经改变
标题确认已经采集到,因为上面有对标题处理的标签,关键字和转换拼音都是使用标题标签
没有理会他,采集时发布到数据库时也提示这个错误
请高手帮忙看看我遇到了什么问题 你用的dll接口吧,看一下你程序哪里出错了. 本帖最后由 iespy 于 2009-5-22 17:33 编辑
首先感谢管理员的回复,对我的帮助很大,现在可以排除是DLL接口的问题
我改了一下发布方式,改成WEB发布模块
以下是我的测试结果:
测试采集规则:
测试时发现依旧是标题处提示错误,但其他标签根据标题处理的标签没有问题
第一个拼音就是根据标题处理的
测试发布模块:
测试时没有任何问题
测试整个任务采集:
提示如图
这里也显示了这个错误,并且采集到数据标题里带有这个错误描述
为了更好的解释我的问题,我把目标页和我的规则也发出来
http://ms.nvq.net.cn/nvqdbApp/htm/zhengcefagui/ecFwPreview-1392.html
规则:
开始-->
<tr>
<td width="72" nowrap>发文标题</td>
<td width="676" colspan="3">
结束-->
</tr> 本帖最后由 iespy 于 2009-5-22 17:46 编辑
补充:
刚刚修改了标题的规则,让标题标签固定为一个值"111111"
但测试采集数据与上面测试采集规则的图一样,依然显示 错误描述
weblog的记录是空的!
页:
[1]