火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3905|回复: 8

新手求天涯论坛的抓取规则,如下地址应该怎么采集?

[复制链接]
发表于 2010-11-19 14:37:02 | 显示全部楼层 |阅读模式
如下地址应该怎么设计采集规则,我想采集前5页,但是地址除了12345变化外,还有后面一个地方在变化。。
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=3&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+13%3A15%3A16&strsubitem=&strsubitem2=
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=4&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+13%3A10%3A22&strsubitem=&strsubitem2=
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=5&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+12%3A55%3A00&strsubitem=&strsubitem2=
发表于 2010-11-19 14:46:02 | 显示全部楼层
他的地址是根据时间来变化 需要通过接口处理
 楼主| 发表于 2010-11-19 14:55:39 | 显示全部楼层
回复 2# 专业收费采集


    能否具体点?
发表于 2010-11-19 14:57:01 | 显示全部楼层
回复 2# 专业收费采集


    怎么解决?
发表于 2010-11-20 05:55:42 | 显示全部楼层
楼主看看教程。写写插件。很容易的。
发表于 2010-11-20 10:44:23 | 显示全部楼层
回复 1# wanmei1608


    看了你的描述,也使用其他方法测试了下这个网站的采集,普通的规则设置实现不了这个分页的采集,一个网址里含有两个变化的参数,这样的需要专门写个程序来处理下这个网址,就是常说的使用插件采集。
发表于 2010-11-20 14:23:19 | 显示全部楼层
其实这个很简单,没你们想像的好么复杂
发表于 2010-11-22 17:45:20 | 显示全部楼层
回复 7# zjyk1984


    怎么解决?
发表于 2010-11-22 17:45:42 | 显示全部楼层
回复 5# luckluck2010


    怎么解决?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-18 10:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表