[请教]采集列表页中N个标签,接着采集内容页中的N个标签问题?
本帖最后由 lyj16900 于 2010-1-9 16:36 编辑如以下:
1。在链接http://www.65xs.com/65xssort1/0/1.htm 中采集到了列表页
比如:http://www.65xs.com/65xsinfo/6/6602.htm
http://www.65xs.com/65xsinfo/*/***.htm
2。接着采集列表页中的http://www.65xs.com/65xsinfo/6/6602.htm 页面中的封面、作者、内容简介等字段。
3。最后需要采集从http://www.65xs.com/65xsinfo/6/6602.htm这个页面的“点击阅读”转到->http://www.65xs.com/files/article/html/5/5846/index.html 这个内容页
进行这个页内的<a href="1398176.html">这样的各章节内容的循环采集。
兄弟们,求解呀,搞了两天,没弄出来。。
自动识别分页(手动)和所属页面(多页)弄得有些不明白了。
ali70ls自力更生搞定了。。 没有朋友愿意帮助的喔? 有没有朋友知道怎么处理的啊?
页:
[1]