求助:分页网址怎么进行采集
我看了些,大家都说是用post来搞。还有抓包,cokkie,啥的。偶不是学计算机的,太专业了就搞不定了。想问下,像这种的http://www.hzrc.com/Qz/Default.aspx,我怎么设置采集网址。主要就是网址,其他的偶都会!最好是比较简单的操作,让我这种菜鸟也能搞定的,多谢了!最好是能够一张张的截图,多谢!或者也欢迎手把手教下,我的QQ:596191726。不慎感激! 你这个 网址 有分页吗? 首先找好一个列表页 啊。。别把首页直接搬出来啊。。。 有时间我给你做下这个 本帖最后由 zhouchanglin 于 2011-1-6 14:20 编辑
搜索后,再翻页,抓包获取数据,全部复制(蓝色部分)贴到火车头httppost模拟工具里,再把下栏的post数据全部复制(蓝色部分)贴到
提交返回,可以看到和ie里翻页看到的不同,内容页脚都有源码,而ie永远不变
翻页时源码里没有了搜索时的很多参数,翻页提交时post数据也没有那些搜索参数,我想可能是通过cooike判断,这个需要登录,记录cooike,从而有不同的数据返回
分页post数据__VIEWSTATE=&PageTo=[分页]&SubmitGo=%D6%B4%D0%D0 记号 向楼上学习了
页:
[1]