rosehu 发表于 2008-11-1 18:35:49

怎么快速采集整站

现在各站点的分类特别细,到最底一级分类,采集回来的内容才几百条,要一条一条加这种链接网址,有没有办法通过站点分析频道或栏目的列表,自动再往下级几级分类进行采集啊?这样就不用填写很多列表网址才能采全站?

rosehu 发表于 2008-11-1 18:42:31

我补充下,我现在主要是采集网址这块怎么多级采还不太会用

chenfy 发表于 2008-11-1 19:02:19

正常采集只能到二级,当然还有其它的方法可以采到更多的级。

tianyuxuan 发表于 2008-11-1 19:27:12

用正则的方式来编写规则就可以了

rosehu 发表于 2008-11-3 20:11:51

楼上的能否详细举例呢?

能否详细说明下怎么写正则呢?

yiyuan1204 发表于 2008-11-3 22:50:42

我觉得你可以写一个规则,然后把相应的列表地址改下就可以了,当然这个方法只是针对一般的站。特别难的就不行噢

rosehu 发表于 2008-11-3 23:22:04

关键是列表问题

其实内容规则还好写些,主要是列表,有些小分类,每个分类才几百条,这样手工一个一个小分类加上去不是要累死人啊?有没有什么快速方法把小分类列表都一网打尽?

rosehu 发表于 2008-11-4 00:01:55

比如此页:
http://y.3edu.net/Index.html
下面一级有
幼儿园所管理(5)
幼儿保育中心(8)
幼儿教学研究(16)
幼儿教案设计(4)
幼儿特色课程(7)
幼儿计划总结(11)
幼儿常用资料(10)
幼儿专题研究(14)
少儿故事大观(18)
幼儿早期教育(8)
幼儿家庭教育(8)
优生优育之家(6)

括号内是每级下的子分类
http://y.3edu.net/gs/ 这是其中少儿故事子分类下面有18个二级列表,进入二级列表才是最终内容页面
http://y.3edu.net/etgs/List_42.html 这是列表的第二页,每个二级列表的数据不同,我该怎么设呢?
有没有详细说下

rosehu 发表于 2008-11-4 19:48:24

自已顶下,有没有人来回答啊,最好配图
页: [1]
查看完整版本: 怎么快速采集整站