zangyue_88 发表于 2007-12-2 18:34:08

采集wiki的时候出现的问题,有办法解决吗?

在wiki的内容页,有很多链接链接到站内的各个页面,这样,采集的时候,如果层次比较深,机器人就会乱爬,把内容里的链接也都爬了,导致分类的错乱,有办法可以解决吗?

zangyue_88 发表于 2007-12-2 18:36:41

里面分类较多
如果都设置成“深度1”的话,就需要人来看管了。

vus520 发表于 2007-12-2 21:31:23

使用正则提取就可以了

小齐 发表于 2007-12-2 22:30:32

我也玩过WIKI挺有意思的.
用采集做WIKI 这个想法很好. 国内有很多不错的WIKI 知识站. 建议兄弟们以后采集WIKI知识站.

cofcn 发表于 2008-2-3 23:43:59

楼主,WIKI如何采集啊???
页: [1]
查看完整版本: 采集wiki的时候出现的问题,有办法解决吗?