主策 发表于 2009-8-28 11:44:41

多页采集高人帮忙看看这个站的规则

http://www.fashionsnap.com/streetsnap/gender/women/

上面是站点地址,需要的是模特大图,每个模特都有6张图片


第一次碰到需要多页采集的站点,还不太会采,各位帮帮忙,尽量说明的详细些,谢谢了~

hssl 发表于 2009-8-28 12:07:50

本帖最后由 hssl 于 2009-8-28 12:14 编辑

多页采集的作用是:
A页面上有个连接可以连接到B页面。
现在你可以采集到了A页面的内容,而这不是你要的,你是想要B页面的。
那么可以写个多页采集,就是当采集A页面的时候,会由A页面得到B页面的地址(因为A页上有B页的连接),然后去采集B页面的内容。
而重点就是怎么从A页面中提取到B页面的地址,这个提取的设置,就是多页采集的设置。
多页采集实际上也是采集网址的过程(即:由一个页面得到改页面中的连接地址),它弥补的是采集地址深度大的时候,不能用很好的规则去提取子地址。
页: [1]
查看完整版本: 多页采集高人帮忙看看这个站的规则