火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5226|回复: 10

建议修复HttpPostGet.exe中的一个小问题

[复制链接]
发表于 2013-5-12 17:07:56 | 显示全部楼层 |阅读模式
今天采集到的一个网站
页面地址可能是通过程序生成的
网址的最是以点号(.)结尾的

如下列的网址

www.****.com/C.M.A.
www.****.com/CO.Tld.

网址结尾有个点号(.)

用浏览器访问,也用HttpAnalyzer的工具测试 都能返回数据,
但是通过火车头的HttpPostGet去访问,就返回404,没法返回数据
也就没办法采集了

这个我想应该是HttpPostGet的问题,不支持识别最后的.点号
建议修复下这个问题,可以支持这类网址。

发表于 2013-5-12 20:42:32 | 显示全部楼层
不是那个原因吧,即便没点好多也是404,多了
发表于 2013-5-14 21:53:59 | 显示全部楼层
确实有这个问题,官方应该验证下
发表于 2013-5-16 19:40:52 | 显示全部楼层
我靠,这个问题很严重,末尾加点,不是404 不404的问题。 整个火车头直接 不识别此后缀格式。
http://www.music123.com/guitars/ ... -vibrato-tailpiece.

不过类似这样的很多了,火车头不知道有没有能力了。
发表于 2013-5-16 19:46:10 | 显示全部楼层
要是找火车头模拟浏览器  打不开的 网站,我至少能帮楼主找20个
 楼主| 发表于 2013-5-17 16:11:22 | 显示全部楼层
我找到了个办法,替换掉点号 不过采集出网址后要先导出网址 然后替换再采集内容,就是有点麻烦
发表于 2013-8-3 03:06:27 | 显示全部楼层
这个门题这个门题这个门题
发表于 2016-2-10 13:37:16 | 显示全部楼层
爪,以后学习下。。
发表于 2016-2-10 14:38:50 | 显示全部楼层
爪,以后学习下。。
发表于 2016-2-10 15:20:17 | 显示全部楼层
爪,以后学习下。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 03:18

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表