在获取列表链接时,网址后带" target="_blank",怎么去除?
我在采集过程中发现有些文章设定为新窗口打开的,<a href="http://*******/m2018082002.html" target="_blank">,而在测试文章页时因后带" target="_blank",网址变为http://*******/m2018082002.html" target="_blank,而导致采集内容无法获取内容,请问有什么办法把网址的" target="_blank这个给去除?自动获取链接的?
页:
[1]