采集图片遇到问题了求教。。。
本帖最后由 nimeilai 于 2021-11-18 11:54 编辑列表里面的地址比较乱
这种要怎么采集,有的是双引号 有的是单引号,有的图片里面还夹着文字 等等
我只想要图片地址
www.baidu.com/view/1.html
<img src="https://123.com/upload/img/1/202/1.jpg"/>
www.baidu.com/view/3.html
这个里面的图片是单引号‘’
<img src='https://123.com/upload/img/1/202/1.jpg'>
www.baidu.com/view/2.html
<img id="aimg_37244670" src="https://123.com/upload/img/1/202/1.jpg"/>
可以试试xpath定位匹配
页:
[1]