火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2384|回复: 4

三级页面采集问题

[复制链接]
发表于 2011-3-1 09:33:15 | 显示全部楼层 |阅读模式
网站整体风格为:首页包含大分类;大分类下有小分类;小分类下是我想采集的数据。
我想从首页下抓取,如何操作。
发表于 2011-3-1 09:57:11 | 显示全部楼层
你好,可以把网址贴出来,大家才能试着给你建议!
发表于 2011-3-1 10:28:25 | 显示全部楼层
我也想看下大家是怎么做的……
发表于 2011-3-1 10:44:41 | 显示全部楼层
一个规则采集不了三级网址,可以考虑用两个规则来采集:第一个规则采集大分类地址并将其发布为txt文本,第二个规则添加向导时使用文本导入模式,导入第一个规则采集的网址,网址深度为2,采集小分类地址及内容
 楼主| 发表于 2011-3-2 15:20:47 | 显示全部楼层
http://www.paper.edu.cn//index.php/default/journal/display_journal_subject/790
我想把这个网页论文题目 作者 期刊等信息都提出来,而且题目 作者 出版日期 要一一对应;
有办法吗
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-18 04:33

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表