sunxm89
发表于 2011-2-16 17:37:04
南京地区是解决了 , 但是江苏其他地区的规则怎么写呢?研究半天没弄出来
能再帮帮忙不
zhouchanglin
发表于 2011-2-17 11:56:14
回复 11# sunxm89
1修改post地址和2post数据即可,使用浏览器地址栏的地址作为post地址是不行的,这个地址城市参数worckcity=%u5357%u4eac%2c编码好像是错的,火车头中会乱码,需要把要搜的城市名字用encodeURIComponent()函数编码,使用编码后的字符串作为worckcity的值,它搜索城市的规则是城市之间用,分割,路要搜北京和上海的数据,搜索的是这样的格式:北京,上海,,然后把 北京,上海,用encodeURIComponent()函数编码,使用编码后的字符串作为worckcity的值,这样的地址是不会出现乱码的
你可以看抓包里德post数据中的divcity_show参数的值,这个就是正确的编码的,使用这个即可
第2步修改post数据里德对应的参数,
需要修改:1;post数据中divcity_show参数代表城市,你可以抓包后获取它后面的值,或者直接找个在线encodeURIComponent()编码网站,把要的 城市名字, 编码,
2:post数据中hid_action参数,代表地址栏当前搜索地址,这个在你改变搜索条件时肯定会改变
3.另外,一些其他post参数的意思下面有说明,改变其值,达到想要的搜索条件post数据是:__EVENTTARGET=lnkbtnNext&__EVENTARGUMENT=&__VIEWSTATE=&__EVENTVALIDATION=&hid_action=align%3DS%26worckcity%3D%25E5%258D%2597%25E4%25BA%25AC%252c%26kwType%3D1&head1%24hid_topID=1&div_show=&divcity_show=%E5%8D%97%E4%BA%AC%2C&ddlPublishDate=-1&ddlWorkYear=-1&ddlSalary=-1&ddlEduRe=-1&chkWorkMethod=-1&txtKeyword=&rdkwtype=1
复制代码其中参数的意思:
hid_action-------------------地址栏当前搜索地址
div_show-------职位类别
divcity_show-------工作地点
ddlPublishDate-------发布日期
ddlWorkYear------工作年限
ddlSalary-----------月薪范围
chkWorkMethod-----------工作类型
ddlEduRe-------学历
txtKeyword---------搜索关键字
rdkwtype--------------职位1 还是企业2
sunxm89
发表于 2011-2-17 12:39:17
很是感谢阿 , 但江苏其他地区的规则该怎么写呢
sunxm89
发表于 2011-2-17 12:42:43
抓包工具我还不会用呢 {:1_201:}
sunxm89
发表于 2011-2-17 12:51:03
大哥,小弟实在是弄不出来 ,笨阿 你能帮帮忙把江苏其他地区的规则写给我下载吗
我这几天可是急坏了,在群里都没人肯帮忙 ,还望大哥能帮这个忙!
sunxm89
发表于 2011-2-18 16:18:33
这个网站的采集规则该怎么写呢
http://www.njrsrc.com/Personal/findJob/result.aspx
huxiaoming168
发表于 2011-2-28 00:05:30
建议楼主把 像那种输入关键字搜索 分页地址不变 这类网站的采集 还是做个视频讲解一下吧 把抓包过程也讲解一下 。许多新手在这块都是一个难点
zdh_zg
发表于 2012-4-4 17:30:02
楼主厉害啊顶{:soso_e179:}{:soso_e179:}{:soso_e179:}
rockyhuang
发表于 2012-4-22 20:17:08
l楼主,发现了新问题,http://www.fsccjys.gov.cn:8080/RMSALEPUBWEB/SaleCount2.aspx,数据就在这个页面上面,不需要再从下一级的页面提取,这时候火车头就遇到问题了。
flaven
发表于 2012-4-25 15:05:37
对于无法把post转成get数据的网站,楼主有什么高招吗?