74sf 发表于 2009-2-9 14:29:06

怎么排除这种空格?

本帖最后由 74sf 于 2009-2-9 14:45 编辑

原代码:
<p>&nbsp;&nbsp;&nbsp;&nbsp;<a href=# target=_blank><font class=a >无用标题</font></a></p>



因为有好几个类似代码,而且 P标记 和 空格 都需要采集,所以我想逐个排除!
我的步骤:
1: HTML标签排除 选择 链接<a 排除A标记
2: 排除规则添加<font>(*)</font>

剩下:
<p>&nbsp;&nbsp;&nbsp;&nbsp;</p>

这个就排除不掉了,直接添加到最后排除,测试还是有,请问怎么排除?
谢谢帮助!ali82ls







wahahahahahahh~~~~~~~~~~ 天才果然不一般!
弄1个小时没弄好,刚才了帖就自己搞定了!
原来不能直接 排除“<p>&nbsp;&nbsp;&nbsp;&nbsp;</p>”
而是应该 这样写“<p>&nbsp;&nbsp;&nbsp;&nbsp;(*)</p>”

我猜 虽然前2步骤排除后,/P标记和前面内容是连在一起的,
但是火车头还是判断/P标记和前面的内容 之间有内容的!
也就是说在排除规则里,顺序靠后的排除规则 会认定前面排除掉的内容还是存在的!
是否???

专业收费采集 发表于 2009-2-9 14:41:04

直接把他过滤就可以啊

74sf 发表于 2009-2-9 14:45:45

谢谢2楼的回复,直接排除不行,呵呵!已经解决了!

连通 发表于 2009-2-9 14:46:59

过滤 &nbsp;
新版这问题应该解决了

74sf 发表于 2009-2-9 15:03:26

呵呵,期待新版!
准备第一时间试用!
页: [1]
查看完整版本: 怎么排除这种空格?