okchina 发表于 2010-8-11 16:15:37

在“采集开始网址”的页面如何得到脚本的网址

我是一个新手,想试着做一个采集规则,我选的页页是新浪的美发这个页面。
网址是:http://eladies.sina.com.cn/beauty/hairdressing/index.shtml
测试的结果得不到中间“美发教室:靓发型”下面的网址:查看原源,发现是放在脚本中,请问高手,如何做采集规则。
<script type="text/javascript">
var data=[        {"title":"夏日约会甜美淑女发型 简易3步轻松教你(组图)","url":"http://eladies.sina.com.cn/beauty/xiufa/p/2010/0811/00391009950.shtml","subtitle":"夏日约会甜美淑女发型 简易3步轻松教","time":"8月11日 00:08"},
        {"title":"活泼优雅 清纯小魔女惊艳短发亮相(组图)","url":"http://eladies.sina.com.cn/beauty/xiufa/p/2010/0811/00371009948.shtml","subtitle":"活泼优雅 清纯小魔女惊艳短发亮相(组","time":"8月11日 00:08"},
        {"title":"落落大方 神秘花园玩转新娘蓬松发(组图)","url":"http://eladies.sina.com.cn/beauty/xiufa/p/2010/0811/00311009945.shtml","subtitle":"落落大方 神秘花园玩转新娘蓬松发(组","time":"8月11日 00:08"},
        {"title":"美丽发源地 头皮养护5大妙法(组图)","url":"http://eladies.sina.com.cn/beauty/xiufa/p/2010/0811/09261009804.shtml","subtitle":"美丽发源地 头皮养护5大妙法(组图)","time":"8月10日 13:08"},
        {"title":"神秘花园 玩转新娘蓬松发(组图)","url":"http://eladies.sina.com.cn/beauty/xiufa/p/2010/0811/09231009802.shtml","subtitle":"神秘花园 玩转新娘蓬松发(组图)","time":"8月10日 12:08"},
。。。。。。
]
var NUM_PER_PAGE=30;
function showContent(curPage){
        var html="<ul>";
        for(var i=(curPage-1)*NUM_PER_PAGE; i<curPage*NUM_PER_PAGE && i<data.length; i++){
                if(i%5==0 && i!=(curPage-1)*NUM_PER_PAGE){
                        html+="</ul><ul>";
                }
                html+='<li><a href="' +data.url+ '" target="_blank" title="'+data.title+'"><img src="http://i2.sinaimg.cn/lx/deco/2008/0308/itemlist_icon.gif" />' +data.subtitle+ '</a><span class="ftime"> '+data.time+'</span></li>';
        }
        html+="</ul>"
        document.getElementById("content_list").innerHTML=html;
}
var opgDnUp=new pgDnUp("pgDnUp",Math.ceil(data.length/NUM_PER_PAGE),Math.ceil(data.length/NUM_PER_PAGE),showContent);
showContent(1);
</script>

wxl08 发表于 2010-8-11 17:48:16

采用手动填写链接地址规则

okchina 发表于 2010-8-11 23:09:53

不能自动分析出来。

okchina 发表于 2010-8-12 10:54:54

回复 2# wxl08


    还有其他的方法吗,有没有自动功能。
页: [1]
查看完整版本: 在“采集开始网址”的页面如何得到脚本的网址