本人愚笨,弄了2天也采集不来,请各位大侠指点下
目标站:http://gougou.blog.dahe.cn/index.htm分页采集 内容规则采集到 就缺桥梁列表了
直接采集列表采集不到
后想了办法 直接用http://gougou.blog.dahe.cn/103330.htm 替换后面的103330,怎奈数值太大火车不转了,也可能是机器KO了
后笨办法手动添加网址,一条一条的,可以采集到,但是基本属于手工添加,毫无成就感
在此问过各位老大,此BLOG是否可以自动采集。感觉是可以,可能我功夫不到家,希望老大们指点一 二,给我捅破那层窗户纸。
学习重在实践,谢过各位老大了 不明白你的列表是什么? 现在的问题是我采集不到内容。我是这样考虑的,页面都采集到了,一般的采集的话,程序是自动采集里面的列表,然后到列表所列文章采集内容。现在我就缺少这个列表。我不知道这样表述版主能理解么。 貌似你的意思是,每个日志独立采集出来.
页:
[1]