超级难度,高手,版主,请进。。
列表页--->信息页链接正则--》获取到的列表为:http://www.xxxx.com/a/b/c/1.html
http://www.xxxx.com/a/b/c/2.html
http://www.xxxx.com/a/b/c/3.html
http://www.xxxx.com/a/b/c/4.html
获取到的页面基本正确,但只是大概的信息。
真正的详细信息要点击:http://www.xxxx.com/a/b/c/xx.html上的连接才能看到。但有规律,如详细信息地址为:
http://www.xxxx.com/a/b/c/xiangxi/xx.html(详细地址,真正要采集的,但列表上没有连接)
http://www.xxxx.com/a/b/c/4.html(获取到的列表值,只有部分信息)
请问这样的可以采集不??
是跟这个有关系的,http://bbs.locoy.com/viewthread.php?tid=31613&highlight=%2Bsnang
[ 本帖最后由 snang 于 2008-10-31 12:57 编辑 ] 这个应该很简单
使用自定义链接地址就可以了
不知道楼主给第地址http://www.xxxx.com/a/b/c/ 的xxxa b c 到底是就这个网址还是xxxx表示某地址!
反正楼主给的几个地址 进去都是转到主页了不知道你到底要采什么 比如:http://www.locoy.com/a/b/c/
a/b/c/是根目录下的路径啊。。
这个楼上不知道吗??? :ali0ls :ali0ls :ali0ls :ali0ls :ali0ls 是可以的 原帖由 沦陷今生 于 2008-10-30 21:36 发表 http://bbs.locoy.com/images/common/back.gif
:ali0ls :ali0ls 是可以的
确定能采集吗?那思路是?? 看看这个。
http://bbs.locoy.com/viewthread.php?tid=31613&highlight=%2Bsnang 这样是可以采集。但不能过滤区域啊。。
难道就没有办法采集了吗??
页:
[1]