shenhualin 发表于 2007-12-28 14:43:07

遇到跳转的页面.怎么采???

文章列表页面:http://www.pinghu.gov.cn/cms/morenews?columnid=1

大家看这里的文章地址是这样的:http://www.pinghu.gov.cn/cms/accesscontrol?endcodurl=vsm>0epdt0ksqi031182339022:99117434:3/iunm'uzqf>1'dje>2'oje>31463

但是点击进去就是一个HTML页面:http://www.pinghu.gov.cn/docs/jrph/20071228/1198800632392.html

这样的跳转页面该用什么方法去获取他的正确地址呢?

fal 发表于 2007-12-28 15:29:41

无所谓的.

http://www.pinghu.gov.cn/cms/accesscontrol?endcodurl=vsm>0epdt0ksqi031182339022:99117434:3/iunm'uzqf>1'dje>2'oje>31463

这个地址可以看到文章源码就够了.

http://www.pinghu.gov.cn/cms/accesscontrol?endcodurl=vsm>0epdt0ksqi031182339022:99117434:3/iunm'uzqf>1'dje>2'oje>31463

这个地址就行了.


[ 本帖最后由 fal 于 2007-12-28 15:34 编辑 ]

shenhualin 发表于 2007-12-28 16:10:39

那这里要怎么写呢?

shenhualin 发表于 2007-12-28 16:12:04

还是采集不到文章内容页面列表   测试网址采集还是0条网址没有文章内容页面

[ 本帖最后由 shenhualin 于 2007-12-28 16:20 编辑 ]

fal 发表于 2007-12-28 16:32:50


写了5页试试.
用自定义连接就可以采.
基本的东西自己找教程学.
页: [1]
查看完整版本: 遇到跳转的页面.怎么采???