pttnt125 发表于 2012-12-26 00:24:10

官方能不能发布一下火车头采集工作的原理

官方的教程我看了5遍了,然后自己去设置发布配置,始终是没办法设置好,一路错到脚,我本人也有点小基础,

自己也都写过一些采集规则,但是我始终不会使用火车头,我想请版主详细介绍一下火车头的工作原理,

比如先讲一下发布接口:登录这块不讲也就算了,然后列表获取跟文章内容发布这两块,程序又是怎么运行的呢?

在我设置的配置当中我明明包含了列表但还是没办法获取列表成功,我心理就疑惑,程序是不是爬html代码,爬到我设置点开始获取里面的数据,

等到爬完结尾再结束这么一个规则,麻烦官方讲清楚一点。还有成功返回的标志。

比如:“成功发布”,"发布成功"等等返回信息,程序是如何辨别的,如果程序像浏览者一样获取信息标志的话,我使用的程序是

服务器端弹窗,像<script> </script>返回的信息,根本不能复制,还是程序是通过爬html代码获取标志获得发布结果。我一直想

不通,教程里也没有这方面的说明。别光教别人这样弄,那样弄,cms那么多,你能一个一个教别人怎么设置吗?

不知道原理,根本不能灵活。

caziyo 发表于 2012-12-26 09:17:02

原理就是模拟POST请求。
要学习的话还是多学习下用Fiddler抓包,以及分析Post请求
页: [1]
查看完整版本: 官方能不能发布一下火车头采集工作的原理