gm2008 发表于 2007-8-1 19:14:05

有些网页标记过滤不掉啊。

我设置了过滤全部标记,
但是有些文章采集的结果是这样的。


郁闷。。。


哪个高手指点一下哦,谢谢了,
QQ 3862720

机电、机械设备、制冷设备、电力设备、电梯电线[缆]等各旧物资设备;及各大商场超市、学校银行、公司企业单位旧货清仓、积压、低债、库存等一切物资物品.欢迎来电!<br />

          <br />
          screen.width-500) {this.width=screen.width-500;}" /> <br />

itanium_chn 发表于 2007-8-2 18:27:16

要在标签设置下面删除

在修改标签那里下面有个内容排除,你把采集下来的内容再排除掉就行了,要增加两个需删除的排除项

rex1984 发表于 2007-8-3 10:09:05

其实这个挺简单的,采集器过滤的主要是最常见的标记,其它过滤不掉的就在“标签设置”里面添加“内容排除”即可,如果来来去去都是那几个标记就把标记直接添加在“内容排除”里,另外附绝招!:你添加这个绝对可以排除所有(是分号后哦~):    <(*)>

不明白可到我的网站留言:)

rex1984 发表于 2007-8-3 10:13:58

:)

yjianfu 发表于 2007-8-6 11:26:14

添加时要注意,有的中间有空格或换行的不能一下全排除,要分开来添加!

qq177489 发表于 2007-8-6 11:57:30

caopeiwei 发表于 2007-8-6 19:25:18

原帖由 rex1984 于 2007-8-3 10:09 发表
其实这个挺简单的,采集器过滤的主要是最常见的标记,其它过滤不掉的就在“标签设置”里面添加“内容排除”即可,如果来来去去都是那几个标记就把标记直接添加在“内容排除”里,另外附绝招!:你添加这个绝对可 ...
基本上不能用。

helps 发表于 2007-8-6 23:16:38

希望3.2能提供这样的功能,此类的问题就好解决了。
http://bbs.locoy.com/viewthread.php?tid=14849&extra=page%3D1

gm2008 发表于 2007-8-7 00:26:02

谢谢各位热心的朋友,
这个问题解决了,再次深表谢意,向你们致敬!
页: [1]
查看完整版本: 有些网页标记过滤不掉啊。