CCTV 的分页怎么采呢?
范例地址:http://pick.cctv.com/20081009/100868_1.shtml分页代码:
<div class="turn_page_box">
<span class="tpb_left">第<b class="current_page">1</b>/<b class="total_page">10</b>页</span>
<script>
try{
var pageno=1
var pagenum=10
var pagename="100868"
var cls_id="C20780000004";
var isNews=(cls_id.charAt(0)!='C'?true:(cls_id.charAt(1)=='N'?true:false))
isNews=false;
if(pagenum>1){
document.write("<span class=\"tpb_right\">");
if(isNews){
if(pageno>1){
document.write("<a class=\"tpb_btn_previous\" href=\""+pagename+"_"+(pageno-1)+".shtml\"><</a> ");
}
for(var i=1;i<=pagenum;i++){
if(i==pageno){
document.write(" <a class=\"cur\">"+i+"</a>");
}else{
document.write(" <a href=\""+pagename+"_"+i+".shtml\">"+i+"</a> ");
}
}
if(pagenum>pageno){
document.write("<a class=\"tpb_btn_next\" href=\""+pagename+"_"+(pageno+1)+".shtml\">></a>");
}
}
else{
if(pageno>1){
document.write("<a href=\""+pagename+(pageno==2?"":"_"+(pageno-2))+".shtml\" class=\"tpb_btn_previous\"><</a>");
}
for(var i=1;i<=pagenum;i++){
if(i==pageno){
document.write(" <a class=\"cur\">"+i+"</a>");
}else{
document.write(" <a href=\""+pagename+(i==1?"":"_"+(i-1))+".shtml\">"+i+"</a> ");
}
}
if(pagenum>pageno){
document.write("<a href=\""+pagename+"_"+pageno+".shtml\" class=\"tpb_btn_next\">></a>");
}
}
document.write("</span>");
}
}catch(e){
}
</script>
</div>
写 <div class="turn_page_box"> 到</div>无法获得正确的地址
自定义的话 怎么写这样的分页代码呢?
谢谢大家! 这个模式好像是自增模式的。采集不到真正的下一页真实地址。不知道哪位高人再看一下。 var pageno=1
表示从1开始吧
var pagenum=10
表示有10个分页吧
var pagename="100868"
表示文章ID吧
问题的关键是 实在不会写 这样的分页规则 和17173分页相似
只给出了起始页,总页数,及页面链接的一个ID
中间页面的链接全是JS根据上面的变量生成的
中间的页面是采不到的
火车的分页不能根据采到的参数进行自增运算
不过用ET倒可以枚举采集
[ 本帖最后由 aven 于 2008-10-9 17:33 编辑 ] 楼上给个明确的提示吧 看起来是挺难的,没有想到解决方法,如果我碰到这种网站,闪人。。。。。最直接!! 对于 最 CCTV的网站
我们这些死机 应该坚持 采光 篡改光 发布光 三光政策~ :( :ali0ls :ali0ls :ali0ls
回复 5楼 的帖子
你没用过ET吗,最新版本2.0,分页URL可以枚举
页:
[1]