火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3359|回复: 5

怎样处理采集内容排除后出现的大量空行?

[复制链接]
发表于 2007-5-28 04:52:42 | 显示全部楼层 |阅读模式
我采集了一个网站,由于需要,我排除了网页的<table>标签,和其它的一些标签,
但是发表出来的内容出现大量的空行,怎么处理? 如:http://www.upupyou.cn/Article/jpyj/200611/940.html
如果不排除标签的话,发表出来的文章就会乱七八糟的的,如:
http://www.upupyou.cn/Article/jpyj/200611/941.html
我采集的网站是http://www.flgw.cn/Index.html
还请各位高人指点一二,小弟在些谢了先.
发表于 2007-5-28 08:03:26 | 显示全部楼层
内容过滤啊
空白也是内容啊。。。
 楼主| 发表于 2007-5-30 16:40:23 | 显示全部楼层
老大,谢谢回复,但是具体点怎么过滤空白内容呀?
 楼主| 发表于 2007-5-30 21:34:02 | 显示全部楼层
哪位老大能帮忙呀?
发表于 2007-10-27 20:27:01 | 显示全部楼层
支持楼上兄弟的问题
发表于 2007-10-27 20:28:25 | 显示全部楼层
谁知道这个问题该如何解决?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-19 09:03

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表