火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5666|回复: 4

涉及到验证码的页面怎么采集

[复制链接]
发表于 2009-8-18 10:28:22 | 显示全部楼层 |阅读模式
1火车车厢
http://zhuanti.cbrc.gov.cn/licence/view.jsp
跳转页面每次要输入验证码才能采集

 楼主| 发表于 2009-8-18 10:28:53 | 显示全部楼层
我也很想知道,顶下
发表于 2009-8-18 10:51:26 | 显示全部楼层
图片的可以写个验证码 的识别 接口

像这种验证码识别率百分之百

但它这介是文字 的,不用识别直接用php模拟提交就应该可以
发表于 2009-8-18 10:51:56 | 显示全部楼层
你只要能想一下,一般此类的网站都是一些普通公司开发的程序,就不会存在验证码的问题了.
  1. POST /licence/view_detail.jsp HTTP/1.1
  2. Accept: image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-silverlight, application/x-shockwave-flash, application/QVOD, application/QVOD, */*
  3. Referer: http://zhuanti.cbrc.gov.cn/licence/confirm.jsp?queryId=50
  4. Accept-Language: zh-cn
  5. Content-Type: application/x-www-form-urlencoded
  6. Accept-Encoding: gzip, deflate
  7. User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; QQDownload 538; .NET CLR 2.0.50727; CIBA; TheWorld)
  8. Host: zhuanti.cbrc.gov.cn
  9. Content-Length: 43
  10. Connection: Keep-Alive
  11. Pragma: no-cache
  12. Cookie: JSESSIONID=KKhxlvnx5nWJp6v7BwvQRZBbKJVHSLJGlvyt3y15pLDpCLXTT1pr!-863211224

  13. id=50&confirmCode=6855&confirm=%CC%E1%BD%BB
复制代码
其中,id是你查询的页面,confirmCode是你当然获取的值,其它的操作请参见手册里post网址采集.
发表于 2009-8-18 11:21:39 | 显示全部楼层
这个似乎直接用火车头采集不了,上次大虫也有采这个东东,嘿嘿
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-9-2 07:50

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表