期待火车头研究出有效反防止采集的程序,例如:
像搜索引擎那样不执行对方的脚本;如何隐藏访问痕迹;无毒且有效代理IP提供租用;等等... 这个现在的火车头就可以,自己用php写个agen 火车头要是能添加上动态代理功能,就可以突破防采集。现在火车头只能实现单一代理IP的设置,建议火车头可以导入代理IP列表,可以设置每采集几个更换一个IP,对于代理是否可用,建议导入的时候有测试并过滤出有用代理IP功能。
当然这样可能有点麻烦。
建议火车头支持https。 我不会自己写代码。楼上的朋友,请把具体方法和代码发一个给我,好吗?先谢谢啦! 原帖由 hzd888 于 2008-4-27 13:15 发表 http://bbs.locoy.com/images/common/back.gif
像搜索引擎那样不执行对方的脚本;如何隐藏访问痕迹;无毒且有效代理IP提供租用;等等...
蔑视你 爪,以后学习下。。
页:
[1]