只想采集内容中夹杂的URL,请问如何操作
不想采集页面的内容以及其他html标签,只想采集该文章页内容里夹杂的URL,我试了很久都没成功,请大家指点一下,谢谢! 比如一个页面很多内容,我只想采集这页里所有URL中<a href="XXXX">asdf<a> XXXX的部分,其他的内容一概不要,请大家帮下,谢谢 应该是一样的吧,规则中首尾分别为:<a href="和<a>
然后把">替换掉 但是那样的话,就连内容一起采集到了,我不想采内容,只想采里面的超链接。。 火车头真的没法搞定这个需求么? 火车头真的没法搞定
页:
[1]