xiongyujie37 发表于 2008-10-9 16:03:46

CCTV 的分页怎么采呢?

范例地址:http://pick.cctv.com/20081009/100868_1.shtml


分页代码:


<div class="turn_page_box">
       <span class="tpb_left">第<b class="current_page">1</b>/<b class="total_page">10</b>页</span>
   <script>
      try{
            var pageno=1
         var pagenum=10
      var pagename="100868"
      var cls_id="C20780000004";
      var isNews=(cls_id.charAt(0)!='C'?true:(cls_id.charAt(1)=='N'?true:false))
                  isNews=false;
      if(pagenum>1){
          document.write("<span class=\"tpb_right\">");
      if(isNews){      
         if(pageno>1){
             document.write("<a class=\"tpb_btn_previous\" href=\""+pagename+"_"+(pageno-1)+".shtml\"><</a> ");
         }
         for(var i=1;i<=pagenum;i++){
             if(i==pageno){            
         document.write(" <a class=\"cur\">"+i+"</a>");
          }else{
               document.write(" <a href=\""+pagename+"_"+i+".shtml\">"+i+"</a> ");
          }   
         }
         if(pagenum>pageno){
            document.write("<a class=\"tpb_btn_next\" href=\""+pagename+"_"+(pageno+1)+".shtml\">></a>");
         }
      }         
      else{
         if(pageno>1){
             document.write("<a href=\""+pagename+(pageno==2?"":"_"+(pageno-2))+".shtml\" class=\"tpb_btn_previous\"><</a>");
         }
         for(var i=1;i<=pagenum;i++){
             if(i==pageno){            
         document.write(" <a class=\"cur\">"+i+"</a>");
          }else{
               document.write(" <a href=\""+pagename+(i==1?"":"_"+(i-1))+".shtml\">"+i+"</a> ");
          }   
         }
         if(pagenum>pageno){
            document.write("<a href=\""+pagename+"_"+pageno+".shtml\" class=\"tpb_btn_next\">></a>");
         }
      }
      document.write("</span>");
   }   
      
   }catch(e){
   }
   </script>
      </div>




写    <div class="turn_page_box">   到</div>无法获得正确的地址


自定义的话 怎么写这样的分页代码呢?

谢谢大家!

xyz5200 发表于 2008-10-9 16:42:16

这个模式好像是自增模式的。采集不到真正的下一页真实地址。不知道哪位高人再看一下。

xiongyujie37 发表于 2008-10-9 17:31:49

var pageno=1
表示从1开始吧

         var pagenum=10

表示有10个分页吧

      var pagename="100868"

表示文章ID吧


问题的关键是 实在不会写 这样的分页规则

aven 发表于 2008-10-9 17:32:03

和17173分页相似 

只给出了起始页,总页数,及页面链接的一个ID

中间页面的链接全是JS根据上面的变量生成的


中间的页面是采不到的

火车的分页不能根据采到的参数进行自增运算

不过用ET倒可以枚举采集

[ 本帖最后由 aven 于 2008-10-9 17:33 编辑 ]

xiongyujie37 发表于 2008-10-9 20:21:49

楼上给个明确的提示吧

chenfy 发表于 2008-10-9 20:42:56

看起来是挺难的,没有想到解决方法,如果我碰到这种网站,闪人。。。。。最直接!!

xiongyujie37 发表于 2008-10-9 21:07:34

对于 最 CCTV的网站

我们这些死机 应该坚持 采光 篡改光 发布光 三光政策~

moseston 发表于 2008-10-10 22:13:02

:( :ali0ls :ali0ls :ali0ls

aven 发表于 2008-10-14 11:32:45

回复 5楼 的帖子

你没用过ET吗,

最新版本2.0,分页URL可以枚举
页: [1]
查看完整版本: CCTV 的分页怎么采呢?