请教高手,关于文章网址的采集
采集某一网站时,遇到网页代码中的网址为:<A href="../shownews.asp?id=5250" target="_blank" class="bz">
<A href="../shownews.asp?id=5258" target="_blank" class="bz">
<A href="../shownews.asp?id=...." target="_blank" class="bz">
实际打开某条新闻的网址为:
http://www.*****.net/news/html/2007/04/20070423092658.htm
http://www.*****.net/news/html/2005/03/20050330093157.htm
请问此情况下如何处理,尝试使用自定义连接格式,但不明白其中的参数1,参数2,(*),有何却别。希望高人指点,不胜感激。 这个不能用自定义连接格式,网址之间没什么联系,你看用ID=之类的网址能采到网址不?如里它是自动跳转的话。。。。。 试了一下,在地址栏中输入http://www.*****.net/shownews.asp?id=5129时,网址自动跳转为http://www.****.net/news/html/2005/03/20050330093157.htm。请问,此情况下,是否可以采集到实际链接地址? 你用火车采。。。。 我现在用的就是火车。 懒得看。。。 楼上什么意思? 我只是请教问题而已。
回复 #7 intohuoche 的帖子
你把具体地址拿出来,由于他跳转了,而且没有规律所以没法替换,拿出来大家帮你看看 原帖由 xyyfx 于 2007-5-16 14:47 发表你把具体地址拿出来,由于他跳转了,而且没有规律所以没法替换,拿出来大家帮你看看
当然的事。。连最基本的条件也没有。谁去帮你。。。 首先向楼上二位表示歉意,下面是这个网站的具体链接:
http://www.firecn.net/showlist.asp?bigclassname=新闻中心&smallclassname=抢险救援
谢谢。
[ 本帖最后由 intohuoche 于 2007-5-16 15:08 编辑 ]
页:
[1]
2