这种特殊的标签图片地址怎么下载下来?
要采集这里面的两张图片,一张是原图,一张是略缩图<p style="text-align: center"><img style="cursor: pointer" onclick="window.open('http://www.abc.com/uploads/allimg/100806/1_100806133436_1.jpg')" border="0" alt="" src="http://www.abc.com/uploads/allimg/100806/1_100806133436_1_lit.jpg" width="391" height="440" />
onclick="window.open('http://www.abc.com/uploads/allimg/100806/1_100806133436_1.jpg')"
这一段里面的 .jpg (略缩图)怎么下载,我觉得火车头是通过识别 <img 来判断 ,1_100806133436_1_lit.jpg 下载没问题
那上面.jpg (1_100806133436_1.jpg) 似乎下载不下来,有没有什么好办法。 您可以将
src="http://www.abc.com/uploads/allimg/100806/1_100806133436_1_lit.jpg" p这块先过滤掉,然后将onclick="window.open('http://www.abc.com/uploads/allimg/100806/1_100806133436_1.jpg')"这一块替换成src="" 这种格式即可.
如果以上还不能解决,可能考虑使用插件处理,然后让采集器去下载.
页:
[1]