火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5190|回复: 9

已经修改了POST随机值,为什么还是不能通过post方式获取列表?

[复制链接]
发表于 2012-4-19 00:00:11 | 显示全部楼层 |阅读模式
本帖最后由 rockyhuang 于 2012-4-19 00:21 编辑

有大侠吗?我在抓http://www.fsccjys.gov.cn:8080/RMSALEPUBWEB/SaleCount2.aspx,post方式获取列表 发送的数据,我已经按照教程例子,把最后不相同的内容修改成 %[POST随机值X]%3D

为啥还不行啊?

我抓下来的包是这样的,第二页:__EVENTTARGET=lnkBtnNext&__EVENTARGUMENT=&__VIEWSTATE=//中间部分相同省略// %2BJx73i3F9eAkqDCAdMo%3D

第三页:__EVENTTARGET=lnkBtnNext&__EVENTARGUMENT=&__VIEWSTATE=//中间部分相同省略// %2Be7azyGGyt4XOIaDaDnjoLoDIWF4%3D
发表于 2012-4-19 11:45:28 | 显示全部楼层
看到头疼的很,这么多代码
 楼主| 发表于 2012-4-21 17:51:39 | 显示全部楼层
版主啊版主!我参考杭州人才网的例子重新分析了一下页面。发现网站的分页是通过lnkBtnNext这个参数来控制的,没有具体数字,和火车头的[分页]参数不一样,请问怎样解决?我是这样写的。
__EVENTTARGET=lnkBtnNext&__EVENTARGUMENT=&__VIEWSTATE=[POST随机值1]
 楼主| 发表于 2012-4-21 23:42:31 | 显示全部楼层
这里好像有解答,http://bbs.locoy.com/spider-56376-1-1.html看看先
 楼主| 发表于 2012-4-22 19:41:20 | 显示全部楼层
悬赏,有人解答吗?
发表于 2012-4-22 21:25:27 | 显示全部楼层
不止后面不一样,中间长串内容也有2处不一样。
 楼主| 发表于 2012-4-23 20:17:22 | 显示全部楼层
用[post随机值]就可以不用管它,是viewstate的value值,直接引用就可以。现在已经可以实现翻页了,但是我才的不是网址列表,而是翻页内容,就这当前页面上,不是在下一级页面上。不知道如何实现。
发表于 2012-4-24 20:21:18 | 显示全部楼层
楼主做个接口模拟post就可以了,可以做到把列表当内容页来采集,因为火车头列表规则目的是获取内容页的,所以处理这类列表即是内容页的采集不容易,做个php接口处理这个post请求相当于内容页模拟post这样就采集到了。

高难度采集 联系QQ:
 楼主| 发表于 2013-2-17 00:04:45 | 显示全部楼层
本帖最后由 rockyhuang 于 2013-2-17 18:02 编辑

用post随机值+手动填写链接地址规则,能采到每个分页的地址了,但是出现了分页网址重复4次,和分页网址无法encode,采不了内容的情况,求解答。
 楼主| 发表于 2013-2-18 11:02:35 | 显示全部楼层
本帖最后由 rockyhuang 于 2013-2-18 11:05 编辑

呵呵,终于搞定了,因为火车头的分页内容采集没有分页网址转urlencode功能,导致分页页面错误,现在只能通过2010版先搬分页网址采集,然后用导出同级网址选项导成TXT,然后收到将+换成%2B,=号换成%3D,手动转成urlencode,然后在用v7版采集,最后导出EXCEL文件。2010版只能导出TXT不能导出EXCEL。免费版的就是无奈,另外管理员在么,能不能改进一下,让分页网址也能够选择URLencode模式。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-9 21:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表