lyj16900 发表于 2010-1-7 22:56:08

[请教]采集列表页中N个标签,接着采集内容页中的N个标签问题?

本帖最后由 lyj16900 于 2010-1-9 16:36 编辑

如以下:

1。在链接http://www.65xs.com/65xssort1/0/1.htm 中采集到了列表页
  比如:http://www.65xs.com/65xsinfo/6/6602.htm
     http://www.65xs.com/65xsinfo/*/***.htm

2。接着采集列表页中的http://www.65xs.com/65xsinfo/6/6602.htm 页面中的封面、作者、内容简介等字段。

3。最后需要采集从http://www.65xs.com/65xsinfo/6/6602.htm这个页面的“点击阅读”转到->http://www.65xs.com/files/article/html/5/5846/index.html 这个内容页

进行这个页内的<a href="1398176.html">这样的各章节内容的循环采集。

兄弟们,求解呀,搞了两天,没弄出来。。

自动识别分页(手动)和所属页面(多页)弄得有些不明白了。


ali70ls自力更生搞定了。。 

lyj16900 发表于 2010-1-8 22:50:34

没有朋友愿意帮助的喔?

lyj16900 发表于 2010-1-8 23:16:20

有没有朋友知道怎么处理的啊?
页: [1]
查看完整版本: [请教]采集列表页中N个标签,接着采集内容页中的N个标签问题?