采集后发布的文章内容格式很乱,规则已上传,请高手指点
我要采集的网址如下:http://www.3366ok.com/html/activity/20110503/25523.shtml发布以后的效果如下:http://www.cdzyr.com/forum.php?mod=viewthread&tid=2770&extra=page%3D1
发布以后的文字格式很乱,有时一行一个字符,不知道是哪里没有设置好,采集很多论坛上的文章都是这样的,请高手指点·
我的规格文件如下:
你是不是把一些html标签过滤掉了呢? 没有的啊!如图 那我就不清楚了 难不成人家有样式控制了? 会不会是火车头在转码的时候出现的问题啊。采集测试完成的结果我用代码预览软件预览都没有问题的啊。一发布之后就不行了!好像我好多贴子都是这样的 有没有人知道怎么样解决啊! 你用HTML发布。{:4_191:} 回复 7# 303718
发布出来更乱了,全是HTML代码 不会吧?是不是规则出错了。 规则应该没有问题,我已经在一楼上传了规则,大家可以看一下!
页:
[1]
2