急!如何采集这个网页的jpg图片
网页地址:http://news.xinhuanet.com/house/2006-10/30/content_5267603.htm这个网页的内容部分有两个图片,一个jpg格式,一个gif格式,但只有gif格式的能采下来,而jpg格式的采不下来,偏偏需要的是jpg格式的,请问如何解决 jpg格式可以采集的,你看看你的任务规则 <P align=center><IMG style="WIDTH: 500px; HEIGHT: 337px" alt=房产 hspace=0 src="xinsrc_1421003301456390312361988.jpg"
要把src=" 这个替换为绝对路径,替换为http://news.xinhuanet.com/house/2006-10/30
图片路径是 http://news.xinhuanet.com/house/2006-10/30/xinsrc_1421003301456390312361988.jpg
多研究研究 将不要的图片用规则过滤再采
页:
[1]