火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1949|回复: 3

为什么规则测试界面显示的数据与采集到的本地数据格式会不一样?

[复制链接]
发表于 2012-4-14 23:30:24 | 显示全部楼层 |阅读模式







测试界面标签内容是带有换行的格式,但是本地数据中却是没有换行,保存进本地TXT或CSV中也是没有换行的格式,请教如何保证采集到的文本内容格式保持与采集来源网站上的一致呢

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2012-4-15 09:32:49 | 显示全部楼层
问题很深奥,看不懂,感觉文字都是一样的,没啥区别啊!
发表于 2012-4-15 09:36:47 | 显示全部楼层
如果你采集的结果有标签 那预览已经把他转换了

如果没有标签 那就是因为 预览的界面要比采集的那个界面宽 就没什么问题了
 楼主| 发表于 2012-4-19 06:20:29 | 显示全部楼层
火车人 发表于 2012-4-15 09:36
如果你采集的结果有标签 那预览已经把他转换了

如果没有标签 那就是因为 预览的界面要比采集的那个界面宽 ...

你说的是什么标签?是说源文件里的</p>之类的换行吗?我一开始以为测试结果跟预览和保存的结果是完全一致的,因此在设置采集的规则的时候就用各种过滤转换等把源文内的HTML标签全部去掉了,并且加了回车换行,让测试结果保持分段的格式。你的意思是如果我要保证保存下来的数据跟被采集网页面上的段落格式一样的话,应该保留页面源文件中的换行HTML标签?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-26 09:59

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表