smalltail 发表于 2008-2-29 16:53:17

本人愚笨,弄了2天也采集不来,请各位大侠指点下

目标站:http://gougou.blog.dahe.cn/index.htm

分页采集 内容规则采集到 就缺桥梁列表了

直接采集列表采集不到
后想了办法 直接用http://gougou.blog.dahe.cn/103330.htm 替换后面的103330,怎奈数值太大火车不转了,也可能是机器KO了
后笨办法手动添加网址,一条一条的,可以采集到,但是基本属于手工添加,毫无成就感

在此问过各位老大,此BLOG是否可以自动采集。感觉是可以,可能我功夫不到家,希望老大们指点一 二,给我捅破那层窗户纸。

学习重在实践,谢过各位老大了

沦陷今生 发表于 2008-2-29 17:02:37

不明白你的列表是什么?

smalltail 发表于 2008-2-29 17:07:46

现在的问题是我采集不到内容。我是这样考虑的,页面都采集到了,一般的采集的话,程序是自动采集里面的列表,然后到列表所列文章采集内容。现在我就缺少这个列表。我不知道这样表述版主能理解么。

沦陷今生 发表于 2008-2-29 17:11:18

貌似你的意思是,每个日志独立采集出来.
页: [1]
查看完整版本: 本人愚笨,弄了2天也采集不来,请各位大侠指点下