nimeilai 发表于 2021-11-18 11:44:47

采集图片遇到问题了求教。。。

本帖最后由 nimeilai 于 2021-11-18 11:54 编辑

列表里面的地址比较乱

这种要怎么采集,有的是双引号 有的是单引号,有的图片里面还夹着文字 等等

我只想要图片地址



www.baidu.com/view/1.html
<img src="https://123.com/upload/img/1/202/1.jpg"/>


www.baidu.com/view/3.html
这个里面的图片是单引号‘’
<img src='https://123.com/upload/img/1/202/1.jpg'>


www.baidu.com/view/2.html
<img id="aimg_37244670" src="https://123.com/upload/img/1/202/1.jpg"/>






leweizxl 发表于 2021-11-23 14:02:03

可以试试xpath定位匹配
页: [1]
查看完整版本: 采集图片遇到问题了求教。。。