zml123 发表于 2012-11-21 09:46:18

多级网址采集实例

本帖最后由 zml123 于 2012-11-30 10:53 编辑

例如我们要采集http://b2b.youboy.com/class.html这个网站的信息!根据网址可以看出有2级网址需要采集!
起始网址就是http://b2b.youboy.com/class.html
一级网址是http://b2b.youboy.com/class2/1_1036/
二级网址是http://b2b.youboy.com/show0cp74986388.html 也就是我们需要采集的内容页网址!
第一步添加起始网址,获取一级网址

第二步继续添加获取网址规则,获取第二级网址,因为这个页面不是一页的,有一个列表页分页的问题,我们把列表页分页那里设置下



测试采集就可以获取到第二级网址了

hxz55 发表于 2012-11-21 19:10:06

最新的火车头不是这样的了.............................................................................................................................................................................

fengjisheng 发表于 2012-11-27 22:41:31

顶你。支持啊。。。

zhonghao528 发表于 2012-12-3 13:12:15

:Q 没看懂。。。。。

dianyingBT.com 发表于 2012-12-3 21:56:19

火车头好难用的啊

network 发表于 2012-12-12 11:16:30

不错支持一下不错支持一下不错支持一下不错支持一下

eday 发表于 2012-12-13 16:22:09

嗯嗯是,正在学习中!谢谢分享。

674161382 发表于 2012-12-17 10:11:36

(⊙v⊙)嗯,顶下,学习中,谢谢分享

denfal 发表于 2012-12-20 09:12:13

楼主,你没有把获取一级网址的设置显示出来呢,

xiyy_001 发表于 2012-12-20 22:55:16

学习了。。。教程清晰,不错
页: [1] 2 3
查看完整版本: 多级网址采集实例