火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1753|回复: 4

超难post任务规则挑战,请高手指点

[复制链接]
发表于 2009-6-1 11:45:34 | 显示全部楼层 |阅读模式
高手过来挑战一下这个任务规则的创建吧,网址是:http://www.cn411.ca/main02view03.aspx?EnIDsOn=012&LinkTreeID=S02010103,.net的__doPostBack调用分页,post data与分页不太一样,很难找到可用规律,分页post data如下:
分页1:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl05&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

分页2:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl06&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

分页3:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl07&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

......

分页10:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl13&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

貌似分页规律关键在:ctl05~ctl13,但是页面上显示的页码是1~10,具体请看网址链接:http://www.cn411.ca/main02view03.aspx?EnIDsOn=012&LinkTreeID=S02010103,目的是采集到所有分页商户的内容链接地址,摸索了好半年,也没有很好的解决办法,请高手指点,挑战一下自己!万分感谢!
发表于 2009-6-1 12:46:09 | 显示全部楼层
本帖最后由 kjmdiba 于 2009-6-1 12:47 编辑

那就直接修改这个数据: 不管他怎么变化, 都存在这些页面. 总10页
ctl05 ---  ctl[分页]     分页:04-13

更方便的可以将: PageSize=10
改为50 或者更多试试. 这样一页就采集完了.
 楼主| 发表于 2009-6-1 21:05:28 | 显示全部楼层
试过这种方法:
那就直接修改这个数据: 不管他怎么变化, 都存在这些页面. 总10页
ctl05 ---  ctl[分页]     分页:04-13

结果是ctl05返回第2页,ctl06又返回第1页,ctl07还是第1页,ctl08以后就出错返回0页了。

也试过这种方法:
更方便的可以将: PageSize=10
改为50 或者更多试试. 这样一页就采集完了.

结果最多可以显示50条信息,可是又无法传递页数参数了...

可郁闷我都, 有啥好的方法吗?
 楼主| 发表于 2009-6-1 21:52:47 | 显示全部楼层
试了n遍,终于找到参数传递规律,也算解决了此问题,多谢大侠给予的帮助。

规律:
第1页:
http://www.cn411.ca/main02view03 ... __EVENTTARGET=ctl00$cphRight$Main0102view_1$ddPageSize&ctl00$cphRight$Main0102view_1$ddPageSize=50

第2页:
http://www.cn411.ca/main02view03 ... __EVENTTARGET=ctl00$cphRight$Main0102view_1$ddPageSize$pb1$ctl05&ctl00$cphRight$Main0102view_1$ddPageSize=50

ctl06,ctl07...
.................
 楼主| 发表于 2009-6-1 21:59:14 | 显示全部楼层
本帖最后由 phoenix2036 于 2009-6-1 22:00 编辑

总的规律:
http://www.cn411.ca/main02view03 ... __EVENTTARGET=ctl00$cphRight$Main0102view_1$ddPageSize$pb1$ctl04&ctl00$cphRight$Main0102view_1$ddPageSize=50

第1,2...页分别是
ctl04,ctl05...

很遗憾的是,用火车的post功能还没有找到好的解决办法。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-20 08:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表