火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6012|回复: 3

请问怎么样过滤掉含有空格符号的空段落。<p>&nbsp;</p>

[复制链接]
发表于 2010-12-29 18:15:55 | 显示全部楼层 |阅读模式
采集出来的数据如下:
  1. <p>互联网发展迅速,网络论坛也随之发展起来。电子论坛即BBS已经是互联网上的一种极为常见的互动交流服务。论坛可以为网友提供开放性的分类讨论区专题服务,网友们可以在此发表自己的观感,交流某些技术,经验等。</p>
  2. <p>BBS已经成为人们获取信息、发表言论的重要场所。它由论坛注册用户所发表的大量主题组成。近些年来,随着计算机的发展的发展,计算机论坛也越来越火,因此建设一个好的BBS显得越来越有必要了。本系统是一个计算机论坛,其中运用了ASP技术、ACCESS数据库等等,实现了一个简单的BBS系统的设计与开发,并详细讨论了该系统的实现过程及其结构。本系统方便的为用户提供简洁的交流界面,用户通过发贴回帖的方式在论坛中进行交流,结合管理员在线对论坛信息进行实时调整管理的最为稳定的计算机交流平台。</p>
  3. <p>&nbsp;</p>
  4. <p>关键字:ASP,Access,计算机论坛</p>
  5. <p>&nbsp;</p>
  6. <h1>&nbsp;</h1>
  7. <p>&nbsp;</p>
  8. <p>&nbsp;</p>
  9. <p>&nbsp;</p>
  10. <p>&nbsp;</p>
  11. <p>&nbsp;</p>
  12. <p>&nbsp;</p>
  13. <p>&nbsp;</p>
  14. <p>&nbsp;</p>
  15. <p>&nbsp;</p>
  16. <p>&nbsp;</p>
  17. <p>&nbsp;</p>
  18. <p>&nbsp;</p>
  19. <p>&nbsp;</p>
  20. <p>&nbsp;</p>
  21. <p>&nbsp;</p>
  22. <p>&nbsp;</p>
  23. <p>&nbsp;</p>
  24. <p>&nbsp;</p>
  25. <p>&nbsp;</p>
  26. <p>&nbsp;</p>
  27. <h1>Abstract</h1>
  28. <p>The rapid development of the Internet, web-based forum also developed. BBS Electronics Forum that is already on the Internet are a very common service interaction. Forum for users to provide the classification of open topic discussion forum service, users can express their feelings, exchange of certain skills, experience and so on. <br/>
复制代码
我想把
  1. <h1>&nbsp;</h1>
复制代码
  1. <p>&nbsp;</p>
复制代码
过滤掉。

但是我在采集的内容替换里这样写。结果却没有用,<p>&nbsp;</p> 还是存在,过滤不掉。请问怎么办?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-12-29 19:31:42 | 显示全部楼层
那你放到左边的排除里
发表于 2010-12-29 20:02:15 | 显示全部楼层
你就直接 这样写 &(*);
 楼主| 发表于 2010-12-30 11:18:36 | 显示全部楼层
楼上的。都不行。

注:

我是先替换 <p(*)>为<p>  之后才变成了<p>&nbsp;</p>

是不是不能2次替换?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-3 15:32

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表