zdl 发表于 2008-10-25 14:20:15

请教链接的采集排除规则怎么写,高手进下,谢谢

网页源代码如下:

喜欢喝<a href="http://www.abc.com/show.asp?id=2322" title="abc">可口可乐</a>吗?

我要把链接去掉,要采集到的为“喜欢喝可口可乐吗?”

在 内容排除 里的规则怎么写呢? 排除 <a href="http://www.abc.com(*)>还有一个</a>呢,如果排除</a>其他的链接会受影响。

·我知道用html标签排除可以,但是那样会把整篇文摘的链接都去掉,不是我要的。我是要在整篇内容里选择性的去掉链接。

采集王 发表于 2008-10-25 22:27:12

冲锋火车头 发表于 2008-10-25 23:56:09

你就这个 干吗非要排除替换了不行吗
页: [1]
查看完整版本: 请教链接的采集排除规则怎么写,高手进下,谢谢