火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2354|回复: 2

这种分页如何采集?

[复制链接]
发表于 2009-8-29 07:07:45 | 显示全部楼层 |阅读模式
示例网址:http://www.lady8844.com/shoushen/jfjy/2009-08-14/1250219701d282195_1.html

分页链接样式写为:<a href='[参数].html'>
但是这里链接网址应该怎样写?
他分页是用的js,js的代码如下:

  1. var PAGELIST=document.all.content_pagelist.innerHTML;
  2. if (PAGELIST.indexOf("上一页")>0 || PAGELIST.indexOf("下一页")>0){
  3. var TEXT_CONTENT=document.all.TEXT_CONTENT.innerHTML;
  4. var S=/<img([^<]+)/gi;
  5. var ARR=S.exec(TEXT_CONTENT);
  6. for(I=1;I<ARR.length;I++){
  7.   var STR="<IMG"+ARR[I];
  8.   TEXT_CONTENT=TEXT_CONTENT.replace(STR,"====");
  9.   var S=new RegExp("<A([^><]+)>====</A>","ig");
  10.   TEXT_CONTENT=TEXT_CONTENT.replace(S,"====");
  11.   var LOCATION=document.location.href;
  12.   var ARRAY=LOCATION.split("\/");
  13.   LOCATION=ARRAY[ARRAY.length-1];
  14.   ARRAY=LOCATION.split(".");
  15.   LOCATION=ARRAY[0];
  16.   if (LOCATION.indexOf("_")>0){
  17.    ARRAY=LOCATION.split("_");
  18.    
  19.    if (PAGELIST.indexOf("下一页")>0){
  20.     LOCATION=ARRAY[0]+"_"+(parseInt(ARRAY[1])+1);
  21.    }
  22.   }else{
  23.    LOCATION=LOCATION+"_1";
  24.   }
  25.   STR=STR.replace("alt=""","alt=""+document.all.TEXT_TITLE.innerHTML+""");
  26.   if (PAGELIST.indexOf("下一页")>0){
  27.    STR="<A HREF='"+LOCATION+".html'>"+STR+"</A>";
  28.   }else{
  29.    STR="<A HREF='../../index.html'>"+STR+"</A>";
  30.   }
  31.   if (PAGELIST.indexOf("下一页")>0){
  32.    STR=STR+"<br/>(点击图片进入下一页)";
  33.   }else{
  34.    STR=STR+"<br/>(点击图片进入下一页)";
  35.   }
  36.   TEXT_CONTENT=TEXT_CONTENT.replace("====",STR);
  37. }
  38. document.all.TEXT_CONTENT.innerHTML=TEXT_CONTENT;
  39. }
  40. if (PAGELIST.indexOf("上一页")>0 && PAGELIST.indexOf("下")<0)
  41. document.all.content_pagelist.innerHTML=document.all.content_pagelist.innerHTML+"<a href='http://www.lady8844.com' target='_blank'><font color=#000000><b>下一页</b></font></a>";
  42. //谷歌上方的位置
  43. //document.write("<iframe marginwidth=0 marginheight=0 hspace=0 vspace=0 src='/IMAGE/ARTICLEFINALLY/PAGE_UP.htm' scrolling=no frameborder=0 width=100% height=25px></iframe>");

复制代码
网址当中的http://www.lady8844.com/shoushen/jfjy/2009-08-14中那个2009-08-14是个变量啊
发表于 2009-8-29 08:11:58 | 显示全部楼层

是内容的分页吗》

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2009-9-2 01:47:48 | 显示全部楼层
谢谢楼上的兄弟{:4_180:}
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-28 22:02

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表