ajax采集案例
原帖:http://bbs.locoy.com/viewthread.php?tid=55069&highlight=AJAX原帖作者分析的较彻底。
对于这类网页的采集,要求采集者有一定的技术。
JS脚本分析,抓包分析数据,又麻烦,又复杂。能不能简单轻松一点呢?
在刀锋采集助手V0.35中运行下面的代码,不用分析脚本,不用抓包就轻松搞定了它。
刀锋采集助手见此帖:http://bbs.locoy.com/spider-65923-1-1.html
//复制到刀锋采集助手V0.35代码编辑器中点击运行试试。
//要保存内容页数据的,请自行配置函数:保存数据("","任务名","标签1","标签2")
//采集多页列表,请自行配置
//下面的代码只采集第一列表页
//延时时间请根据网络情况适当的增减。
循环(1,0){
打开网页("http://insurance.jrj.com.cn/action/SearchIP.jspa?insuranceTypeId=4",2,30000,"c")
延时(2000)
循环点击节点(1,"","A","分红型","",2,30000,10,"b")
延时(2000)
//保存数据("","任务名","标签1","标签2")
}
简单吧,几行代码就搞定。 再来一例。
原帖地址:http://bbs.locoy.com/viewthread.php?tid=56372&highlight=ajax
采集地址:http://www.landscape.cn/news/xwzx.html
其它不多说了,直接来采集代码。
循环(1,0){
打开网页("http://www.landscape.cn/news/xwzx.html",2,30000,"c")
延时(2000)
循环点击节点(1,"","A","全文","",2,30000,10,"b")
延时(2000)
//保存数据("","任务名","标签1","标签2")
} 再来一例:
原帖地址:http://bbs.locoy.com/viewthread.php?tid=57540&highlight=ajax
采集地址:http://www.centaline-cis.com/ccom/cpropsrch.aspx
采集代码如下:
循环(1,10){
打开网页("http://www.centaline-cis.com/ccom/cpropsrch.aspx",2,30000,"c")//打开网页
延时(2000)
下拉框("PropSrch_llbDistrict",i1,true,"")//设置下拉框的值
点击节点("","INPUT","id","PropSrch_btnAddDistrictT","","",2,30000,10,"c")//把下拉框的值移到已选地区
点击节点("","INPUT","id","btnSearch","","",2,30000,10,"c")//点击搜寻按钮
延时(10000)
//保存数据("","任务名","标签1","标签2")
} :lol{:soso_e183:} 开始匹配标签,怎么就一直没反应了
页:
[1]