遇到跳转的页面.怎么采???
文章列表页面:http://www.pinghu.gov.cn/cms/morenews?columnid=1大家看这里的文章地址是这样的:http://www.pinghu.gov.cn/cms/accesscontrol?endcodurl=vsm>0epdt0ksqi031182339022:99117434:3/iunm'uzqf>1'dje>2'oje>31463
但是点击进去就是一个HTML页面:http://www.pinghu.gov.cn/docs/jrph/20071228/1198800632392.html
这样的跳转页面该用什么方法去获取他的正确地址呢? 无所谓的.
用
http://www.pinghu.gov.cn/cms/accesscontrol?endcodurl=vsm>0epdt0ksqi031182339022:99117434:3/iunm'uzqf>1'dje>2'oje>31463
这个地址可以看到文章源码就够了.
采
http://www.pinghu.gov.cn/cms/accesscontrol?endcodurl=vsm>0epdt0ksqi031182339022:99117434:3/iunm'uzqf>1'dje>2'oje>31463
这个地址就行了.
[ 本帖最后由 fal 于 2007-12-28 15:34 编辑 ] 那这里要怎么写呢? 还是采集不到文章内容页面列表 测试网址采集还是0条网址没有文章内容页面
[ 本帖最后由 shenhualin 于 2007-12-28 16:20 编辑 ]
写了5页试试.
用自定义连接就可以采.
基本的东西自己找教程学.
页:
[1]