高手帮帮忙
碰到一个网站http://www.eladies.hk/fashion/clothing/网站的图片采下来命名都是一样,到后来image文夹里就只有一张图片了,我现在想把每篇的图片都要抓下来,并且图片命名都要与内容里的命名相同,因为导数据的时候是根据命名来判断的。 你采集的这个网站里面的图片有两种后缀名,ti.jpg和p.jpg。因为域名后面http://simg.sina.com.hk/后缀前面的这一段是随机值/p.jpg,所以采集器里没办法用原文件名命名下载下来全部图片,可以使用随机文件名格式的进行匹配命名。
页:
[1]