speculator 发表于 2007-5-13 22:24:41

奇怪,采集正常,发到cms上就丢失大量内容

手工测试采集的时候一切ok,发到cms上就会把大量的内容丢失,比如img的链接。。。
另外,我发现火车头会把原文中的内容的编码格式改变,比如把"改为&idou;之类的,许多cms可能就会发生错误,因为&是一个保留字符,希望火车头不要老是自动修改内容。

神仙下凡 发表于 2007-6-19 18:15:03

同问

天毅 发表于 2007-6-20 10:41:12

&遇到这个字符火车会认为一个数据结束 自动截取掉后便的内容
编码格式改变这个我没有深入研究过
不过按常理 "和&idou; 在页面上显示出来的应该是一样的
当然 如果你的编辑器会自动保留html格式的话 在页面上会出现 &idou; 这个东西的
我测试过 dedecms ecms和一般的php的cms的编辑器没有这个问题

学而时习之 发表于 2007-6-20 19:24:56

不是cms的问题,是空间的问题。有的空间不支持倒入&,你可以测试。

hobby 发表于 2007-6-20 22:36:43

原帖由 学而时习之 于 2007-6-20 19:24 发表
不是cms的问题,是空间的问题。有的空间不支持倒入&,你可以测试。

不可能吧

我用的是php168系统


用他自身带的采集器采集完全正常


但是用火车头采集发布 带有 & 的地址...就是发布不成功...地址都被过滤了!

麻烦火车头老大改进下...

谢谢!

学而时习之 发表于 2007-6-21 17:12:06

回复 #5 hobby 的帖子

php168自带的采集器正常,是因为无导库的过程。有的空间为了防止注入,限制了&的导入。教你个办法,将&在规则内过滤后再测试。
页: [1]
查看完整版本: 奇怪,采集正常,发到cms上就丢失大量内容