xiaotianxing 发表于 2014-5-7 15:39:37

在第一步采集网址规则中,user-agent选择谷歌浏览器,但是默认还是使用了IE的COOKIE.

在第一步采集网址规则中,user-agent选择谷歌浏览器,但是默认还是使用了IE的COOKIE.

290576138 发表于 2014-6-29 12:06:46

火车头选择浏览器仅仅是个摆设,如果你是想通过选择浏览器获取COOKIE,这个时候,选择功能是个版设,

仅仅是所有工作做完之后,选择浏览器才算有效。就是说登录的时候 是通过火车头自带模拟器登录咋U包的


火车头自带的抓包软件 抓COOKIE的时候根本不考虑什么浏览器,比较霸道。

290576138 发表于 2014-6-29 12:17:17

下次希望强化自带抓包工具,起码能自定义浏览器,客服说对吗,要不然这个抓包工具,真的就是摆设了。
以前反馈过,客服说让用别的抓包,无语。

就不能变通下,现在好多网站都不支持IE6了,而火车头自带浏览器内核低于IE6,更起不到抓包的意义了。

290576138 发表于 2014-6-29 12:21:39

理论上感觉模拟器可以强化,可以更好模拟抓包,实际上,不知道是什么问题官方也不升级。要是能把抓包工具,强化到火车头内部,该多好呀。 还有就是规则自动登录功能,上次摆弄哪个大黄蜂半天,发现也没用,这里完全能做到的,至少PHP可以自动登录,自动调用浏览器,所以理论上可行

290576138 发表于 2014-6-29 12:28:06

我觉得火车头如果能调用按键精灵插件脚本,火车头是通过请求做批量操作的,按键精灵是通过 外部模拟控制操作的,2个软件如果能结合起来。现在的什么验证码。什么打码,什么防采集,什么JS 运行后才能采集的东西,都是小问题了,希望官方能跟按键精灵合作一下,开发出来一款辅助操作式的采集器。

比如有些网页,不是说采集源码就简单了,一些请求火车头是模拟不了的,但是按键可以做到直接复制输出端的信息,根本不用模拟请求,这样一来,请求模拟输出+ 模拟复制操作,这天下没有不能采集发布的东西了。

290576138 发表于 2014-6-29 12:33:36

前几天见有软件2013年C语言开发出来的。任何论坛都能发。根本不需要写发布模块
完全就是一块 按键精灵+代码类的 发帖软件。看完之后感触颇深。
希望火车头借鉴一些。根本不需要做任何发布模块,非常容易写的代码

我这里不做广告。发布原理就是 直接调用对方发布窗口,然后把东西自动替换进输入框

软件只管发信息就可以。

至于输入框位置,完全不是用的锁定 方位IP,用的 IFRAME 替换调用。

看了非常牛逼。火车头做不到的,这个软件确实可以做到,不服不行。希望火车头后期,像简单化


可视化方向迈进。不要老是模拟HTTP请求做一些东西,虽然效率客观,但是适应性操作性极差。

290576138 发表于 2014-6-29 12:33:59

易语言写的:(:(:(:(

290576138 发表于 2014-6-29 12:53:30

希望开发出来一款可视化批量下载和批量发布的采集器
采集器,不一定非要自己去模拟请求发布一些数据
完全可以操作浏览器的请求结果,下载和发布数据。
通过可视化操作,批量操作前台的批量操作,完成任务,比较傻瓜,通用性和实用性都很强。效率偏低

290576138 发表于 2014-6-29 13:35:17

假如10年后,所有网站都防采集,都要打码,火车头还是想通过请求方式收集信息。是不是已经落后了。
唯一能经得起考验的就是 完全模拟人工的发帖机 和OCR打码机。
页: [1]
查看完整版本: 在第一步采集网址规则中,user-agent选择谷歌浏览器,但是默认还是使用了IE的COOKIE.