xuxinunuon 发表于 2010-11-20 19:21:46

只想采集内容中夹杂的URL,请问如何操作

不想采集页面的内容以及其他html标签,只想采集该文章页内容里夹杂的URL,我试了很久都没成功,请大家指点一下,谢谢!

xuxinunuon 发表于 2010-11-21 16:45:11

比如一个页面很多内容,我只想采集这页里所有URL中<a href="XXXX">asdf<a> XXXX的部分,其他的内容一概不要,请大家帮下,谢谢

away 发表于 2010-11-22 20:49:51

应该是一样的吧,

规则中首尾分别为:<a href="和<a>
然后把">替换掉

xuxinunuon 发表于 2010-11-22 21:18:46

但是那样的话,就连内容一起采集到了,我不想采内容,只想采里面的超链接。。

xuxinunuon 发表于 2010-11-24 20:05:01

火车头真的没法搞定这个需求么?

zhuoyue52 发表于 2010-11-24 21:17:50

火车头真的没法搞定
页: [1]
查看完整版本: 只想采集内容中夹杂的URL,请问如何操作