火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: zhouchanglin

javascript之post网站用get方式采集实例

[复制链接]
发表于 2011-2-16 17:37:04 | 显示全部楼层
南京地区是解决了 , 但是江苏其他地区的规则怎么写呢?研究半天没弄出来

能再帮帮忙不
 楼主| 发表于 2011-2-17 11:56:14 | 显示全部楼层
回复 11# sunxm89

1修改post地址和2post数据即可,使用浏览器地址栏的地址作为post地址是不行的,这个地址城市参数worckcity=%u5357%u4eac%2c编码好像是错的,火车头中会乱码,需要把要搜的城市名字用encodeURIComponent()函数编码,使用编码后的字符串作为worckcity的值,它搜索城市的规则是城市之间用,分割,路要搜北京和上海的数据,搜索的是这样的格式:
  1. 北京,上海,
复制代码
,然后把 北京,上海,  用encodeURIComponent()函数编码,使用编码后的字符串作为worckcity的值,这样的地址是不会出现乱码的

你可以看抓包里德post数据中的divcity_show参数的值,这个就是正确的编码的,使用这个即可

第2步修改post数据里德对应的参数,
需要修改:1;post数据中divcity_show参数代表城市,你可以抓包后获取它后面的值,或者直接找个在线encodeURIComponent()编码网站,把要的 城市名字, 编码,
2:post数据中hid_action参数,代表地址栏当前搜索地址,这个在你改变搜索条件时肯定会改变
3.另外,一些其他post参数的意思下面有说明,改变其值,达到想要的搜索条件
  1. post数据是:__EVENTTARGET=lnkbtnNext&__EVENTARGUMENT=&__VIEWSTATE=[POST随机值1]&__EVENTVALIDATION=[POST随机值2]&hid_action=align%3DS%26worckcity%3D%25E5%258D%2597%25E4%25BA%25AC%252c%26kwType%3D1&head1%24hid_topID=1&div_show=&divcity_show=%E5%8D%97%E4%BA%AC%2C&ddlPublishDate=-1&ddlWorkYear=-1&ddlSalary=-1&ddlEduRe=-1&chkWorkMethod=-1&txtKeyword=&rdkwtype=1
  2. 复制代码其中参数的意思:
  3. hid_action-------------------地址栏当前搜索地址

  4. div_show-------职位类别
  5. divcity_show-------工作地点
  6. ddlPublishDate-------发布日期
  7. ddlWorkYear------工作年限
  8. ddlSalary-----------月薪范围
  9. chkWorkMethod-----------工作类型
  10. ddlEduRe-------学历
  11. txtKeyword---------搜索关键字

  12. rdkwtype--------------职位1 还是企业2
复制代码
发表于 2011-2-17 12:39:17 | 显示全部楼层
很是感谢阿 , 但江苏其他地区的规则该怎么写呢
发表于 2011-2-17 12:42:43 | 显示全部楼层
抓包工具我还不会用呢
发表于 2011-2-17 12:51:03 | 显示全部楼层
大哥,小弟实在是弄不出来 ,笨阿   你能帮帮忙  把江苏其他地区的规则写给我下载吗

我这几天可是急坏了,在群里都没人肯帮忙 ,还望大哥能帮这个忙!
发表于 2011-2-18 16:18:33 | 显示全部楼层
这个网站的采集规则该怎么写呢

http://www.njrsrc.com/Personal/findJob/result.aspx
发表于 2011-2-28 00:05:30 | 显示全部楼层
建议楼主把 像那种输入关键字搜索  分页地址不变 这类网站的采集 还是做个视频讲解一下吧 把抓包过程也讲解一下 。许多新手在这块都是一个难点
发表于 2012-4-4 17:30:02 | 显示全部楼层
楼主厉害啊顶{:soso_e179:}{:soso_e179:}{:soso_e179:}
发表于 2012-4-22 20:17:08 | 显示全部楼层
l楼主,发现了新问题,http://www.fsccjys.gov.cn:8080/RMSALEPUBWEB/SaleCount2.aspx,数据就在这个页面上面,不需要再从下一级的页面提取,这时候火车头就遇到问题了。
发表于 2012-4-25 15:05:37 | 显示全部楼层
对于无法把post转成get数据的网站,楼主有什么高招吗?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 02:04

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表