snang 发表于 2008-10-30 18:42:23

超级难度,高手,版主,请进。。

列表页--->信息页链接正则--》获取到的列表为:
http://www.xxxx.com/a/b/c/1.html
http://www.xxxx.com/a/b/c/2.html
http://www.xxxx.com/a/b/c/3.html
http://www.xxxx.com/a/b/c/4.html
获取到的页面基本正确,但只是大概的信息。

真正的详细信息要点击:http://www.xxxx.com/a/b/c/xx.html上的连接才能看到。但有规律,如详细信息地址为:
http://www.xxxx.com/a/b/c/xiangxi/xx.html(详细地址,真正要采集的,但列表上没有连接)
http://www.xxxx.com/a/b/c/4.html(获取到的列表值,只有部分信息)


请问这样的可以采集不??


是跟这个有关系的,http://bbs.locoy.com/viewthread.php?tid=31613&highlight=%2Bsnang

[ 本帖最后由 snang 于 2008-10-31 12:57 编辑 ]

冲锋火车头 发表于 2008-10-30 18:55:44

这个应该很简单
使用自定义链接地址就可以了

不知道楼主给第地址http://www.xxxx.com/a/b/c/ 的xxxa b c 到底是就这个网址还是xxxx表示某地址!
反正楼主给的几个地址 进去都是转到主页了不知道你到底要采什么

snang 发表于 2008-10-30 19:00:29

比如:http://www.locoy.com/a/b/c/

a/b/c/是根目录下的路径啊。。
这个楼上不知道吗???

snang 发表于 2008-10-30 19:50:21

:ali0ls :ali0ls :ali0ls

沦陷今生 发表于 2008-10-30 21:36:30

:ali0ls :ali0ls 是可以的

snang 发表于 2008-10-31 09:07:40

原帖由 沦陷今生 于 2008-10-30 21:36 发表 http://bbs.locoy.com/images/common/back.gif
:ali0ls :ali0ls 是可以的


确定能采集吗?那思路是??

snang 发表于 2008-10-31 12:57:44

看看这个。
http://bbs.locoy.com/viewthread.php?tid=31613&highlight=%2Bsnang

snang 发表于 2008-11-3 13:16:05

这样是可以采集。但不能过滤区域啊。。


难道就没有办法采集了吗??
页: [1]
查看完整版本: 超级难度,高手,版主,请进。。