intohuoche 发表于 2007-5-15 15:55:59

请教高手,关于文章网址的采集

采集某一网站时,遇到网页代码中的网址为:
<A href="../shownews.asp?id=5250" target="_blank" class="bz">
<A href="../shownews.asp?id=5258" target="_blank" class="bz">
<A href="../shownews.asp?id=...." target="_blank" class="bz">
实际打开某条新闻的网址为:
http://www.*****.net/news/html/2007/04/20070423092658.htm
http://www.*****.net/news/html/2005/03/20050330093157.htm
请问此情况下如何处理,尝试使用自定义连接格式,但不明白其中的参数1,参数2,(*),有何却别。希望高人指点,不胜感激。

rq204 发表于 2007-5-15 21:28:59

这个不能用自定义连接格式,网址之间没什么联系,你看用ID=之类的网址能采到网址不?如里它是自动跳转的话。。。。。

intohuoche 发表于 2007-5-16 10:18:50

试了一下,在地址栏中输入http://www.*****.net/shownews.asp?id=5129时,网址自动跳转为http://www.****.net/news/html/2005/03/20050330093157.htm。请问,此情况下,是否可以采集到实际链接地址?

rq204 发表于 2007-5-16 12:00:15

你用火车采。。。。

intohuoche 发表于 2007-5-16 13:37:07

我现在用的就是火车。

黄埔三少 发表于 2007-5-16 14:37:48

懒得看。。。

intohuoche 发表于 2007-5-16 14:43:10

楼上什么意思? 我只是请教问题而已。

xyyfx 发表于 2007-5-16 14:47:29

回复 #7 intohuoche 的帖子

你把具体地址拿出来,由于他跳转了,而且没有规律所以没法替换,拿出来大家帮你看看

黄埔三少 发表于 2007-5-16 14:54:17

原帖由 xyyfx 于 2007-5-16 14:47 发表
你把具体地址拿出来,由于他跳转了,而且没有规律所以没法替换,拿出来大家帮你看看


当然的事。。连最基本的条件也没有。谁去帮你。。。

intohuoche 发表于 2007-5-16 15:04:22

首先向楼上二位表示歉意,下面是这个网站的具体链接:
http://www.firecn.net/showlist.asp?bigclassname=新闻中心&smallclassname=抢险救援
谢谢。

[ 本帖最后由 intohuoche 于 2007-5-16 15:08 编辑 ]
页: [1] 2
查看完整版本: 请教高手,关于文章网址的采集