求解组图的网址怎么采集???
比如http://www.zgnt.net/content/2013-04/10/content_2182532.htm求高手教下 这就是普通的分页文章采集呢内容页分页设置文字教程 http://bbs.locoy.com/spider-132761-1-1.html
你好!这个网址http://www.zgnt.net/content/2013-04/10/content_2182532.htm里面的采组图,需要设置标签下分页获取规则->上下页/上n页下n页,分页网址获取区域为从<!--/enpcontent-->到<!--/enpcontent--> 分页链接地址样式为<span>(*)</span> <a href=[参数]>(*)</a> 分页网址为http://www.zgnt.net/content/2013-04/10/[参数1],不要忘了,新建一个新标签,在标签里勾选,该标签循环匹配和该标签在分页中匹配,提取数据时我选的是正则提取,内容如下:正则匹配内容:<p (*)<img id="(*)"(*)src="../../../[参数]"/>组合结果:<img src="http://www.zgnt.net/[参数1]"/>,还有一点一定得记得勾选下载图片这样一选项,如果没有设置文件路径,系统会自动下到默认地址去,当然你也可以自己设置。希望对你有帮助哈
页:
[1]