火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1778|回复: 4

求助-为什么采集不到网址?

[复制链接]
发表于 2010-7-5 10:51:09 | 显示全部楼层 |阅读模式
本帖最后由 jeman 于 2010-7-7 16:09 编辑

http://new.hxrc.com/JobSearchResult.aspx?SearchKind=2&KeyWord=%u798f%u6e05
这个页面为什么采集不到招聘信息的地址?很奇怪,这个页面是post方式得到网址的,就算不用post只取第一页也是得不到网址
地址必须包含:CompanyOneJobDetail.aspx?jobGuid=

post数据
  1. __VIEWSTATE=[POST随机值1]&select=%E8%AF%B7%E9%80%89%E6%8B%A9%E8%81%8C%E4%BD%8D%E7%B1%BB%E5%88%AB&select2=%E8%AF%B7%E9%80%89%E6%8B%A9%E5%8F%91%E5%B8%83%E6%97%B6%E9%97%B4&textfield=%E8%AF%B7%E8%BE%93%E5%85%A5%E5%85%B3%E9%94%AE%E5%AD%97%E6%9F%A5%E8%AF%A2&__EVENTTARGET=AspNetPager1&__EVENTARGUMENT=[分页]
复制代码
分页标签:1-5页

随机值前字符串:<input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="
随机值后字符串:" />
分上面设置的采集不到对应的地址
我啥都不设置就采集第一页的话也是得不到有得的地址?折腾了很久,实在找不到原先,所以来这里求各位朋友帮我看看什么原因
版本:V2009 sp4或V3.2SP5都试过。
发表于 2010-7-5 12:13:40 | 显示全部楼层
可以获得的,没有问题
 楼主| 发表于 2010-7-5 12:53:50 | 显示全部楼层
本帖最后由 jeman 于 2010-7-5 12:56 编辑

不是吧?你那边能得到数据吗?我怎么不行噢?我就只能得到下列地址

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-7-6 02:00:44 | 显示全部楼层
是没问题才对的``
 楼主| 发表于 2010-7-6 09:35:30 | 显示全部楼层
唉,折腾了许久,总算找出问题所在了,原来是url要utf-8编码,用gb2312编码的话就取不了地址

  1. [b]福清[/b] 编码[b]%E7%A6%8F%E6%B8%85[/b](utf-8编码方式)
  2. [b]%u798f%u6e05[/b] 解码 [b]福清[/b](编码方式)
复制代码
可是为什么第一页的url是
http://new.hxrc.com/JobSearchResult.aspx?SearchKind=2&KeyWord=%u798f%u6e05
却能看到搜索的内容,再用%u798f%u6e05 post方式取得网址就取不到其它页的url了
http://new.hxrc.com/JobSearchResult.aspx?SearchKind=2&KeyWord=%E7%A6%8F%E6%B8%85这样就可以了
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-19 02:04

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表