火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3092|回复: 8

CCTV 的分页怎么采呢?

[复制链接]
发表于 2008-10-9 16:03:46 | 显示全部楼层 |阅读模式
范例地址:http://pick.cctv.com/20081009/100868_1.shtml


分页代码:


  1. <div class="turn_page_box">
  2.        <span class="tpb_left">第<b class="current_page">1</b>/<b class="total_page">10</b>页</span>
  3.      <script>
  4.         try{
  5.             var pageno=1
  6.          var pagenum=10
  7.       var pagename="100868"
  8.       var cls_id="C20780000004";
  9.       var isNews=(cls_id.charAt(0)!='C'?true:(cls_id.charAt(1)=='N'?true:false))
  10.                   isNews=false;
  11.       if(pagenum>1){
  12.           document.write("<span class="tpb_right">");
  13.         if(isNews){      
  14.          if(pageno>1){
  15.              document.write("<a class="tpb_btn_previous" href=""+pagename+"_"+(pageno-1)+".shtml"  ><</a> ");
  16.          }
  17.          for(var i=1;i<=pagenum;i++){
  18.              if(i==pageno){            
  19.            document.write(" <a class="cur">"+i+"</a>");
  20.           }else{
  21.                  document.write(" <a href=""+pagename+"_"+i+".shtml">"+i+"</a> ");
  22.           }   
  23.          }
  24.          if(pagenum>pageno){
  25.             document.write("<a class="tpb_btn_next" href=""+pagename+"_"+(pageno+1)+".shtml">></a>");
  26.          }
  27.       }         
  28.       else{
  29.            if(pageno>1){
  30.              document.write("<a href=""+pagename+(pageno==2?"":"_"+(pageno-2))+".shtml" class="tpb_btn_previous"><</a>");
  31.          }
  32.          for(var i=1;i<=pagenum;i++){
  33.              if(i==pageno){            
  34.            document.write(" <a class="cur">"+i+"</a>");
  35.           }else{
  36.                  document.write(" <a href=""+pagename+(i==1?"":"_"+(i-1))+".shtml">"+i+"</a> ");
  37.           }   
  38.          }
  39.          if(pagenum>pageno){
  40.             document.write("<a href=""+pagename+"_"+pageno+".shtml" class="tpb_btn_next">></a>");
  41.          }
  42.       }
  43.       document.write("</span>");
  44.      }   
  45.         
  46.      }catch(e){
  47.      }
  48.      </script>
  49.       </div>
复制代码




写    <div class="turn_page_box">   到  </div>  无法获得正确的地址


自定义的话 怎么写这样的分页代码呢?

谢谢大家!
发表于 2008-10-9 16:42:16 | 显示全部楼层
这个模式好像是自增模式的。采集不到真正的下一页真实地址。不知道哪位高人再看一下。
 楼主| 发表于 2008-10-9 17:31:49 | 显示全部楼层
var pageno=1
表示从1开始吧

         var pagenum=10

表示有10个分页吧

      var pagename="100868"

表示文章ID吧


问题的关键是 实在不会写 这样的分页规则
发表于 2008-10-9 17:32:03 | 显示全部楼层
和17173分页相似 

只给出了起始页,总页数,及页面链接的一个ID

中间页面的链接全是JS根据上面的变量生成的


中间的页面是采不到的

火车的分页不能根据采到的参数进行自增运算

不过用ET倒可以枚举采集

[ 本帖最后由 aven 于 2008-10-9 17:33 编辑 ]
 楼主| 发表于 2008-10-9 20:21:49 | 显示全部楼层
楼上给个明确的提示吧
发表于 2008-10-9 20:42:56 | 显示全部楼层
看起来是挺难的,没有想到解决方法,如果我碰到这种网站,闪人。。。。。最直接!!
 楼主| 发表于 2008-10-9 21:07:34 | 显示全部楼层
对于 最 CCTV的网站

我们这些死机 应该坚持 采光 篡改光 发布光 三光政策~
发表于 2008-10-10 22:13:02 | 显示全部楼层
发表于 2008-10-14 11:32:45 | 显示全部楼层

回复 5楼 的帖子

你没用过ET吗,

最新版本2.0,分页URL可以枚举
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 17:20

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表