18551672700 发表于 2020-5-12 16:10:18

求教一个采集网址都是两个域名如何避免

采集网址 网页内代码如下:
<a href="//www.111.com/qiye/4187.htm">低压电器公司</a>


每次采集得到的网址都是
https://www.111.com/www.111.com/search/4187.htm


域名出现两次,如何避免?

18551672700 发表于 2020-5-12 16:16:17

问题已解决
手动填写链接地址规则   把域名直接不获取
<h4><a target="_blank" href="//www.111.com[参数]"
页: [1]
查看完整版本: 求教一个采集网址都是两个域名如何避免