wishstech 发表于 2011-1-5 10:49:50

求助:分页网址怎么进行采集

我看了些,大家都说是用post来搞。还有抓包,cokkie,啥的。偶不是学计算机的,太专业了就搞不定了。想问下,像这种的http://www.hzrc.com/Qz/Default.aspx,我怎么设置采集网址。主要就是网址,其他的偶都会!最好是比较简单的操作,让我这种菜鸟也能搞定的,多谢了!
最好是能够一张张的截图,多谢!或者也欢迎手把手教下,我的QQ:596191726。不慎感激!

zhongzuzhu 发表于 2011-1-5 15:34:00

你这个 网址 有分页吗?

52listen 发表于 2011-1-5 18:11:21

首先找好一个列表页 啊。。别把首页直接搬出来啊。。。

zhouchanglin 发表于 2011-1-5 20:40:16

有时间我给你做下这个

zhouchanglin 发表于 2011-1-6 14:17:13

本帖最后由 zhouchanglin 于 2011-1-6 14:20 编辑

搜索后,再翻页,抓包获取数据,全部复制(蓝色部分)贴到火车头httppost模拟工具里,再把下栏的post数据全部复制(蓝色部分)贴到

提交返回,可以看到和ie里翻页看到的不同,内容页脚都有源码,而ie永远不变

翻页时源码里没有了搜索时的很多参数,翻页提交时post数据也没有那些搜索参数,我想可能是通过cooike判断,这个需要登录,记录cooike,从而有不同的数据返回
分页post数据__VIEWSTATE=&PageTo=[分页]&SubmitGo=%D6%B4%D0%D0

scyl 发表于 2011-1-6 14:47:26

记号 向楼上学习了
页: [1]
查看完整版本: 求助:分页网址怎么进行采集