dp84 发表于 2011-7-23 12:45:36

如何在内容中排除纯文本形式的网址?

请问应该怎样编写规则才能在采集的文章内容中排除像 http://www.***.html 这样不带<a>标签的纯文本形式的网址?

谢谢了!

303718 发表于 2011-7-23 12:47:53

http://www(*).html 这种加到排除里就行了呢

dp84 发表于 2011-7-23 13:03:06

这种加到排除里就行了呢
303718 发表于 2011-7-23 12:47 http://bbs.locoy.com/images/common/back.gif


   这样加不行,没有任何效果。

303718 发表于 2011-7-23 13:03:57

那就是你规则有问题了。

caifanzi 发表于 2011-7-23 17:39:46

加到过滤里不就行了。2楼没错
页: [1]
查看完整版本: 如何在内容中排除纯文本形式的网址?