dk2dk2 发表于 2012-4-14 23:30:24

为什么规则测试界面显示的数据与采集到的本地数据格式会不一样?








测试界面标签内容是带有换行的格式,但是本地数据中却是没有换行,保存进本地TXT或CSV中也是没有换行的格式,请教如何保证采集到的文本内容格式保持与采集来源网站上的一致呢

huuu2 发表于 2012-4-15 09:32:49

问题很深奥,看不懂,感觉文字都是一样的,没啥区别啊!

火车人 发表于 2012-4-15 09:36:47

如果你采集的结果有标签 那预览已经把他转换了

如果没有标签 那就是因为 预览的界面要比采集的那个界面宽 就没什么问题了

dk2dk2 发表于 2012-4-19 06:20:29

火车人 发表于 2012-4-15 09:36 static/image/common/back.gif
如果你采集的结果有标签 那预览已经把他转换了

如果没有标签 那就是因为 预览的界面要比采集的那个界面宽 ...

你说的是什么标签?是说源文件里的</p>之类的换行吗?我一开始以为测试结果跟预览和保存的结果是完全一致的,因此在设置采集的规则的时候就用各种过滤转换等把源文内的HTML标签全部去掉了,并且加了回车换行,让测试结果保持分段的格式。你的意思是如果我要保证保存下来的数据跟被采集网页面上的段落格式一样的话,应该保留页面源文件中的换行HTML标签?
页: [1]
查看完整版本: 为什么规则测试界面显示的数据与采集到的本地数据格式会不一样?