lxfh985ii 发表于 2007-12-2 17:20:33

这个网址如何采集才对?

这两天这个问题搞得我有点晕~~~看教程也没看出个所以然来,所以还是在这里发贴让各位高手指点一下~~
图片的地址代码:<TABLE cellSpacing=0 cellPadding=0 width="100%" height=350 border=0><TR><TD vAlign=center align=middle height=350>
<a href="http://www.pcpop.com/pp/82070_160979.html#t" target="_self"><img src="http://img4.pcpop.com/PicImages/480x480/0/141/000141736.jpg" border="0" /></a>
</td></tr></table>
我是从这个网址采集的:http://www.pcpop.com/pp/t007400171_11358_1.html
分析后得出:http://www.pcpop.com/pp/t82070_1.html这个地址,看到这里还有列表,再分析,找到图片地址在:http://www.pcpop.com/pp/82070_160978.html这个网页中,偶一下晕了~~~~这该如何采集啊??我想在一个页面中把所有黎姿的图片全发出来,而不是像找到的那样一页一张图片,这样可以吗?

我想如果按采集的去收集,光一个人我就要发一百多贴,怎么想也不对啊,我想问一下这个网址采集的正确思路是什么??谢谢啊~~~

lxfh985ii 发表于 2007-12-2 17:23:14

我看了正则的教程,看的并不是太懂,实在是没办法了,如果有这样套图之类的网站我们应该如何去正确采集里面的内容呢?跪谢~~~

fal 发表于 2007-12-2 17:43:22

下面三个地址
1.黎姿列表页面内的略缩图地址
2.打开具体页面后,幻灯片,自动播放位的图片地址.
3.原图片.


http://img4.pcpop.com/PicImages/120x120/0/141/000141736.jpg
http://img4.pcpop.com/PicImages/480x480/0/141/000141736.jpg
http://img4.pcpop.com/PicImages/0x0/0/141/000141736.jpg

规律很明显.
把http://www.pcpop.com/pp/t82070_1.html页做内容页,
抓略缩图图片地址,做替换.

[ 本帖最后由 fal 于 2007-12-2 17:50 编辑 ]

vus520 发表于 2007-12-2 18:15:47

#t" target="_self"><img src="[参数]" border="0" /></a>

lxfh985ii 发表于 2007-12-3 20:37:32

原帖由 fal 于 2007-12-2 17:43 发表 http://bbs.locoy.com/images/common/back.gif
下面三个地址
1.黎姿列表页面内的略缩图地址
2.打开具体页面后,幻灯片,自动播放位的图片地址.
3.原图片.


http://img4.pcpop.com/PicImages/120x120/0/141/000141736.jpg
http://img4.pcpop.com/PicImages/ ...


再次感谢你的帮助。

[ 本帖最后由 lxfh985ii 于 2007-12-3 21:14 编辑 ]

lxfh985ii 发表于 2007-12-3 20:41:22

我靠,妈的,太阴了~~~用变换网址的方法来对付采集~!!有能对付这类情况的办法吗???

fal 发表于 2007-12-3 21:13:01

我看了.网址没变.
我想你没明白我的意思.
我是让你把
http://www.pcpop.com/pp/t82070_1.html
这个页面作为实际页面来采集.而不是把他当成列表页面来采集网址.
在这个页面里把所有略缩图地址采集出来.再用替换,把略缩图地址替换成真实图片的地址.
页: [1]
查看完整版本: 这个网址如何采集才对?