火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2505|回复: 6

是否无法从国家统计局上采集产品名称?

[复制链接]
发表于 2014-5-11 02:54:57 | 显示全部楼层 |阅读模式
想从国家统计局网站上提取出产品名称的信息,导出到excel表中,网址是http://www.stats.gov.cn/tjsj/tjbz/tjypflml/index.html 。
这个网址的特点是产品信息是分成几集目录的,比如第一级“农业产品” http://www.stats.gov.cn/zjtj/tjbz/tjypflml/2010/01.html,在农业产品页,又有19种产品名称,网址形式是http://www.stats.gov.cn/zjtj/tjbz/tjypflml/2010/01/0101.html,在每一个产品名称又可以点击进入,下一级的产品名称还可以继续点击,直到最后到了最细化的产品无法继续点击
按照教程试了试,还是实现不了,主要是两个问题:
1,这种很多级的网址形式的变化,火车采集器好像实现不了
2,只需要采集到产品名称,最后输出的是一大长串产品名称,可内容规则编写完一测试,采集不到具体的产品名称,只采集了产品名称的数字编号

请前辈们指点,谢谢!
发表于 2014-5-11 09:52:43 | 显示全部楼层
多级的一直添加级别采下去就行了呢。火车头支持无限级采集的
 楼主| 发表于 2014-5-11 12:07:34 | 显示全部楼层
303718 发表于 2014-5-11 09:52
多级的一直添加级别采下去就行了呢。火车头支持无限级采集的

那采集规则呢?按照视频教程里的方法写规则,最后只出来产品的编号,出不来产品名称
发表于 2014-5-11 13:00:35 | 显示全部楼层

<tr class='villagetr'><td>(*)</td><td>


</td>
 楼主| 发表于 2014-5-11 13:29:59 | 显示全部楼层
j3399520 发表于 2014-5-11 13:00

(*)



还是不行啊

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2014-5-12 09:41:22 | 显示全部楼层
晕,规则是没错的。具体看你自己的设置问题了。  另外,友情提示下:这个规则是采集终极页的,不是你上面测试的主页,主页是用来采集网址的,而不是内容。


最后,还是建议你多学习下相关知识。
 楼主| 发表于 2014-5-12 23:59:51 | 显示全部楼层
j3399520 发表于 2014-5-12 09:41
晕,规则是没错的。具体看你自己的设置问题了。  另外,友情提示下:这个规则是采集终极页的,不是你上面测 ...

哦哦,谢谢。。。应该看哪个资料学习更好更快?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-15 20:28

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表