火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 8253|回复: 13

求助:关于登录网站后台的POST、Referer来源地址设置的困惑

[复制链接]
发表于 2017-4-17 09:43:02 | 显示全部楼层 |阅读模式
本帖最后由 hjmincd 于 2017-4-17 13:57 编辑

要在网站发布采集的格式化内容、或已编辑好的文章,首先需要通过采集器登陆到网站后台、获取栏目列表、传送格式化内容再发布;
本人在尝试用采集器登陆公司网站时,由于不能准确设置Post地址和来源地址,导致登陆总是不成功。
过程是:先用fiddler抓包分析登陆过程:抓包数据有,POST地址为“http://www.gc001.com/bdtlogin.do”、Referer地址为“ http://www.gc001.com/shopmms/”;

图示如下:

(图一、人工登陆不正确数据)

(图二、人工登陆到后台)

(图三、登陆后调出首页/栏目列表)

(图四、栏目列表嵌在网页代码中)

于是在采集器Web发布设置时,将网站自动登陆参数——网站地址设为“http://www.gc001.com”、登陆地址后缀设为“bdtlogin.do"、来源地址后缀设为“/shopmms/”;

如此设置后,无论是采用内置浏览器、还是数据包方式均不能成功登陆;用内置浏览器登陆时显示“没有获取到任何分类设置,请检查配置”;用数据包方式登陆显示“登陆失败,请检查配置!{"error":0;"msg":"/shopmms/main.html"}、或“自动登陆失败,Invalid URI:The hostname could not be Parsed System.Net.HttpWebRequist CreateRequist()”。

(调看登陆地址后缀文件人工登陆时JSON内容是不一样的,也就是起反馈传送作用;成功时是“error=0;msg=/shopmms/main.html"、失败时是“”error=1,[对不起,用户名或密码错误,或您的账户尚未开通!]);

由此可知,将网站地址设为“http://www.gc001.com”或许就是不对的(因为此时即便是选择内置浏览器登陆,调出的也仅是公众网页面,而非后台页面;)

分析来分析去,应该还是POST地址设置有问题;宥于自身网络知识匮乏,实在找不到症结在哪、琢磨不出解决方法。此特向各位采集达人求助,请不吝赐教;先受本人一拜!


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2017-4-17 11:56:15 | 显示全部楼层
登录成功后  有提示的  在模块里设置下成功标志码以及失败提示
 楼主| 发表于 2017-4-17 11:57:21 | 显示全部楼层
本帖最后由 hjmincd 于 2017-4-17 14:13 编辑

如果将根地址设置为:www.gc001.com,那么登陆地址后缀就应该设置为“/bdtlogin.do”、来源地址后缀为“/shopmms/”;

而bdtlogin.do的作用或许就是传递两种情形下的信息、和要响应的页面,如:
登陆信息正确时,“error=0;msg=/shopmms/main.html",表示登陆信息无误、调出后台页面;
登陆信息错误时,“error=1;[对不起,用户名或密码错误;或您的账户尚未开通!]”;

但如此设置,即便是内置浏览器登录都只会弹出公众网页(www.gc001.com),而不会调出后台登陆页面(www.gc001.com\shopmms);
换作数据包登陆则直接显示"自动登陆失败:Invalid URI:the hostname could not be parsed.System.Net.HttpWebRequest CreaterRequist()"。

那么,能不能将网站页面设置为“(www.gc001.com\shopmms”呢??按照火车说明书规则,这不是登陆地址与来源地址共有的部分,登陆地址后缀已经没办法填了,是不行的;

那么,是否问题还是出在登陆地址后缀“/bdtlogin.do”这个环节呢?
发表于 2017-4-17 12:20:45 | 显示全部楼层
hjmincd 发表于 2017-4-17 11:57
困惑是:在发布配置参数设置时,如果将根地址设置为:www.gc001.com,那么登陆地址后缀就应该设置为“/bdtlogin ...

那就是后台的提示问题了
 楼主| 发表于 2017-4-17 13:22:11 | 显示全部楼层
困惑是:在发布配置参数设置时,如果将根地址设置为:www.gc001.com,那么登陆地址后缀就应该设置为“/bdtlogin.do"、来源地址后缀即应是“\shopmms”;但bdtlogin.do在登陆成功时内容为“error=0;msg="\shopmms\main.html”、登陆不成功时的内容为“error=1;[对不起,用户名或密码输入有误,或者您的账号没有开通!”
发表于 2017-4-17 13:54:18 | 显示全部楼层
hjmincd 发表于 2017-4-17 13:22
困惑是:在发布配置参数设置时,如果将根地址设置为:www.gc001.com,那么登陆地址后缀就应该设置为“/bdtlogin ...

是的呀  对应设置到成功提示和失败提示里
发表于 2017-4-17 14:21:20 | 显示全部楼层
hjmincd 发表于 2017-4-17 11:57
如果将根地址设置为:www.gc001.com,那么登陆地址后缀就应该设置为“/bdtlogin.do”、来源地址后缀为“/shop ...

跟地址是没有关系的  你模块设置添加设置上成功和失败提示就可以了
 楼主| 发表于 2017-4-17 14:53:42 | 显示全部楼层
先感谢@leweizxl!!!
再附上采集器自动登录的设置参数(截图):






除了网站地址、登陆地址后缀和来源地址后缀的获取与拼接出错,想不出还有哪个环节了;
感觉自己网络知识太贫乏了!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2017-4-18 23:51:27 | 显示全部楼层
从[img]昨晚九点到今26个小时,居然无一人点击浏览;;好冷!!难道也要用红包来炸???

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2017-4-20 00:54:46 | 显示全部楼层
红包已备起,人工置顶,!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 19:36

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表