wanmei1608 发表于 2010-11-19 14:37:02

新手求天涯论坛的抓取规则,如下地址应该怎么采集?

如下地址应该怎么设计采集规则,我想采集前5页,但是地址除了12345变化外,还有后面一个地方在变化。。
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=3&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+13%3A15%3A16&strsubitem=&strsubitem2=
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=4&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+13%3A10%3A22&strsubitem=&strsubitem2=
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=5&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+12%3A55%3A00&strsubitem=&strsubitem2=

专业收费采集 发表于 2010-11-19 14:46:02

他的地址是根据时间来变化 需要通过接口处理

wanmei1608 发表于 2010-11-19 14:55:39

回复 2# 专业收费采集


    能否具体点?

xd1943 发表于 2010-11-19 14:57:01

回复 2# 专业收费采集


    怎么解决?

luckluck2010 发表于 2010-11-20 05:55:42

楼主看看教程。写写插件。很容易的。

lxy2010 发表于 2010-11-20 10:44:23

回复 1# wanmei1608


    看了你的描述,也使用其他方法测试了下这个网站的采集,普通的规则设置实现不了这个分页的采集,一个网址里含有两个变化的参数,这样的需要专门写个程序来处理下这个网址,就是常说的使用插件采集。

zjyk1984 发表于 2010-11-20 14:23:19

其实这个很简单,没你们想像的好么复杂

xd1943 发表于 2010-11-22 17:45:20

回复 7# zjyk1984


    怎么解决?

xd1943 发表于 2010-11-22 17:45:42

回复 5# luckluck2010


    怎么解决?
页: [1]
查看完整版本: 新手求天涯论坛的抓取规则,如下地址应该怎么采集?