oybgood1988 发表于 2009-8-31 16:43:17

求教大家个问题

我不知道火车头怎么去抓取他多级下的东西,比如我要得到每个页面的包地址,而每个页面的包地址有很多步,1.选择手机品牌2.选择机型3.才是游戏大全。怎么去写规则。??谢谢!

fishfxl 发表于 2009-8-31 17:43:25

你把目标网址发来看看嘛,这样说看不懂

oybgood1988 发表于 2009-8-31 18:54:56

http://www.9520.com/   帮看下!

fishfxl 发表于 2009-9-1 11:45:59

网页打不开。。估计被公司网络屏蔽了,不过我可以告诉你我采集多级网页的方法,你自己再参考一下。
就是起始页设置为http://www.9520.com/ ,采集深度设置为2,然后根据内容页的规律填写,“文章内容页面的地址必须包含”和“不得包含”两项,填写正确的话就能转到你需要采集的内容页了。然后就会根据你的规则来抓取内容。

oybgood1988 发表于 2009-9-1 13:55:41

我说的是不只2级能采吗?比方说 http://www.9520.com/SelectBrand.html 这个起始页,他分手机牌子,点下个页面又分手机型号,又点下个页面才是游戏,但你想得到游戏包下载地址还得点一下到下载页面!呼呼,级别好深啊?有办法吗???
页: [1]
查看完整版本: 求教大家个问题