dfzs 发表于 2011-10-8 15:42:10

ajax采集案例

原帖:http://bbs.locoy.com/viewthread.php?tid=55069&highlight=AJAX
原帖作者分析的较彻底。
对于这类网页的采集,要求采集者有一定的技术。
JS脚本分析,抓包分析数据,又麻烦,又复杂。能不能简单轻松一点呢?
在刀锋采集助手V0.35中运行下面的代码,不用分析脚本,不用抓包就轻松搞定了它。
刀锋采集助手见此帖:http://bbs.locoy.com/spider-65923-1-1.html


//复制到刀锋采集助手V0.35代码编辑器中点击运行试试。
//要保存内容页数据的,请自行配置函数:保存数据("","任务名","标签1","标签2")
//采集多页列表,请自行配置
//下面的代码只采集第一列表页
//延时时间请根据网络情况适当的增减。
循环(1,0){
    打开网页("http://insurance.jrj.com.cn/action/SearchIP.jspa?insuranceTypeId=4",2,30000,"c")
    延时(2000)
    循环点击节点(1,"","A","分红型","",2,30000,10,"b")
    延时(2000)
    //保存数据("","任务名","标签1","标签2")
}

简单吧,几行代码就搞定。

dfzs 发表于 2011-10-8 17:32:45

再来一例。
原帖地址:http://bbs.locoy.com/viewthread.php?tid=56372&highlight=ajax
采集地址:http://www.landscape.cn/news/xwzx.html
其它不多说了,直接来采集代码。

循环(1,0){
    打开网页("http://www.landscape.cn/news/xwzx.html",2,30000,"c")
    延时(2000)
    循环点击节点(1,"","A","全文","",2,30000,10,"b")
    延时(2000)
    //保存数据("","任务名","标签1","标签2")
}

dfzs 发表于 2011-10-8 18:07:13

再来一例:
原帖地址:http://bbs.locoy.com/viewthread.php?tid=57540&highlight=ajax
采集地址:http://www.centaline-cis.com/ccom/cpropsrch.aspx

采集代码如下:

循环(1,10){
    打开网页("http://www.centaline-cis.com/ccom/cpropsrch.aspx",2,30000,"c")//打开网页
    延时(2000)
    下拉框("PropSrch_llbDistrict",i1,true,"")//设置下拉框的值
    点击节点("","INPUT","id","PropSrch_btnAddDistrictT","","",2,30000,10,"c")//把下拉框的值移到已选地区
    点击节点("","INPUT","id","btnSearch","","",2,30000,10,"c")//点击搜寻按钮
    延时(10000)
    //保存数据("","任务名","标签1","标签2")
}

0575sos 发表于 2012-9-4 22:40:19

:lol{:soso_e183:}

0575sos 发表于 2012-9-5 13:36:30

开始匹配标签,怎么就一直没反应了
页: [1]
查看完整版本: ajax采集案例