phoenix2036 发表于 2009-6-1 11:45:34

超难post任务规则挑战,请高手指点

高手过来挑战一下这个任务规则的创建吧,网址是:http://www.cn411.ca/main02view03.aspx?EnIDsOn=012&LinkTreeID=S02010103,.net的__doPostBack调用分页,post data与分页不太一样,很难找到可用规律,分页post data如下:
分页1:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl05&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

分页2:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl06&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

分页3:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl07&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

......

分页10:
__EVENTTARGET=ctl00%24cphRight%24Main0102view_1%24pb1%24ctl13&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%
24tbEmail=&ctl00%24cphLeft%24LeftMenu1%24LoginAjax1%24tbPassword=&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%240=on&ctl00%24cphRight%24Main0102view_1%
24cbEnIDs%241=on&ctl00%24cphRight%24Main0102view_1%24cbEnIDs%242=on&ctl00%24cphRight%24Main0102view_1%24ddOrderBy=3&ctl00%24cphRight%24Main0102view_1%
24ddPageSize=10

貌似分页规律关键在:ctl05~ctl13,但是页面上显示的页码是1~10,具体请看网址链接:http://www.cn411.ca/main02view03.aspx?EnIDsOn=012&LinkTreeID=S02010103,目的是采集到所有分页商户的内容链接地址,摸索了好半年,也没有很好的解决办法,请高手指点,挑战一下自己!万分感谢!

kjmdiba 发表于 2009-6-1 12:46:09

本帖最后由 kjmdiba 于 2009-6-1 12:47 编辑

那就直接修改这个数据: 不管他怎么变化, 都存在这些页面. 总10页
ctl05 ---ctl[分页]   分页:04-13

更方便的可以将: PageSize=10
改为50 或者更多试试. 这样一页就采集完了.

phoenix2036 发表于 2009-6-1 21:05:28

试过这种方法:
那就直接修改这个数据: 不管他怎么变化, 都存在这些页面. 总10页
ctl05 ---ctl[分页]   分页:04-13

结果是ctl05返回第2页,ctl06又返回第1页,ctl07还是第1页,ctl08以后就出错返回0页了。

也试过这种方法:
更方便的可以将: PageSize=10
改为50 或者更多试试. 这样一页就采集完了.

结果最多可以显示50条信息,可是又无法传递页数参数了...

可郁闷我都, 有啥好的方法吗?

phoenix2036 发表于 2009-6-1 21:52:47

试了n遍,终于找到参数传递规律,也算解决了此问题,多谢大侠给予的帮助。

规律:
第1页:
http://www.cn411.ca/main02view03.aspx?EnIDsOn=012&LinkTreeID=S02010103&__EVENTTARGET=ctl00$cphRight$Main0102view_1$ddPageSize&ctl00$cphRight$Main0102view_1$ddPageSize=50

第2页:
http://www.cn411.ca/main02view03.aspx?EnIDsOn=012&LinkTreeID=S02010103&__EVENTTARGET=ctl00$cphRight$Main0102view_1$ddPageSize$pb1$ctl05&ctl00$cphRight$Main0102view_1$ddPageSize=50

ctl06,ctl07...
.................

phoenix2036 发表于 2009-6-1 21:59:14

本帖最后由 phoenix2036 于 2009-6-1 22:00 编辑

总的规律:
http://www.cn411.ca/main02view03 ... __EVENTTARGET=ctl00$cphRight$Main0102view_1$ddPageSize$pb1$ctl04&ctl00$cphRight$Main0102view_1$ddPageSize=50

第1,2...页分别是
ctl04,ctl05...

很遗憾的是,用火车的post功能还没有找到好的解决办法。
页: [1]
查看完整版本: 超难post任务规则挑战,请高手指点