如何在内容中排除纯文本形式的网址？

dp84 发表于 2011-7-23 12:45:36

请问应该怎样编写规则才能在采集的文章内容中排除像 http://www.***.html 这样不带<a>标签的纯文本形式的网址？

谢谢了！

303718 发表于 2011-7-23 12:47:53

http://www(*).html 这种加到排除里就行了呢

dp84 发表于 2011-7-23 13:03:06

这种加到排除里就行了呢
303718 发表于 2011-7-23 12:47 http://bbs.locoy.com/images/common/back.gif

这样加不行，没有任何效果。

303718 发表于 2011-7-23 13:03:57

那就是你规则有问题了。

caifanzi 发表于 2011-7-23 17:39:46

加到过滤里不就行了。2楼没错

页: [1]

火车采集器软件交流官方论坛's Archiver