火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 7289|回复: 8

怎么快速采集整站

[复制链接]
发表于 2008-11-1 18:35:49 | 显示全部楼层 |阅读模式
1火车车厢
现在各站点的分类特别细,到最底一级分类,采集回来的内容才几百条,要一条一条加这种链接网址,有没有办法通过站点分析频道或栏目的列表,自动再往下级几级分类进行采集啊?这样就不用填写很多列表网址才能采全站?

 楼主| 发表于 2008-11-1 18:42:31 | 显示全部楼层
我补充下,我现在主要是采集网址这块怎么多级采还不太会用
发表于 2008-11-1 19:02:19 | 显示全部楼层
正常采集只能到二级,当然还有其它的方法可以采到更多的级。
发表于 2008-11-1 19:27:12 | 显示全部楼层
用正则的方式来编写规则就可以了
 楼主| 发表于 2008-11-3 20:11:51 | 显示全部楼层

楼上的能否详细举例呢?

能否详细说明下怎么写正则呢?
发表于 2008-11-3 22:50:42 | 显示全部楼层
我觉得你可以写一个规则,然后把相应的列表地址改下就可以了,当然这个方法只是针对一般的站。特别难的就不行噢
 楼主| 发表于 2008-11-3 23:22:04 | 显示全部楼层

关键是列表问题

其实内容规则还好写些,主要是列表,有些小分类,每个分类才几百条,这样手工一个一个小分类加上去不是要累死人啊?有没有什么快速方法把小分类列表都一网打尽?
 楼主| 发表于 2008-11-4 00:01:55 | 显示全部楼层
比如此页:
http://y.3edu.net/Index.html
下面一级有
幼儿园所管理(5)
幼儿保育中心(8)
幼儿教学研究(16)
幼儿教案设计(4)
幼儿特色课程(7)
幼儿计划总结(11)
幼儿常用资料(10)
幼儿专题研究(14)
少儿故事大观(18)
幼儿早期教育(8)
幼儿家庭教育(8)
优生优育之家(6)

括号内是每级下的子分类
http://y.3edu.net/gs/ 这是其中少儿故事子分类下面有18个二级列表,进入二级列表才是最终内容页面
http://y.3edu.net/etgs/List_42.html 这是列表的第二页,每个二级列表的数据不同,我该怎么设呢?
有没有详细说下
 楼主| 发表于 2008-11-4 19:48:24 | 显示全部楼层
自已顶下,有没有人来回答啊,最好配图
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-9-10 01:48

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表