火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2881|回复: 4

一个有难度的js有关的一个网页

[复制链接]
发表于 2011-7-28 17:51:49 | 显示全部楼层 |阅读模式
http://www.cde.org.cn/schedule/cata.do?method=list  我想要采集里边的 在审品种目录浏览  受理品种目录浏览 这两个分类下的东西   但是这个页面更改条件,或是翻页页面的地址都是不变的,我试过用分页地址,就是地下1,2,3分页上边JS的链接地址,发现页面确实变化了,但是内容却始终不变,求高手解决一下,谢谢
 楼主| 发表于 2011-7-28 17:52:34 | 显示全部楼层
自己先顶一下 希望大家能看到我的帖子
发表于 2011-7-28 20:38:02 | 显示全部楼层
晕.这种可以采的呀.哪里不行呀
 楼主| 发表于 2011-7-29 10:01:47 | 显示全部楼层
我是新手 不会啊  指导一下呗
发表于 2011-9-5 16:43:46 | 显示全部楼层
翻页提交了表单,

第3页翻页
  1. <a style="font-size: 13px; color: #0033CC;" href="#" onclick="test('cata.do?method=list?method=list&pageroffset=40','1')">3&nbsp;&nbsp;</a>
复制代码
触发了test(),,
  1. function test(url){
  2.                
  3.                 var arr = new Array();
  4.                 arr = url.split('pageroffset=');
  5.                 var pageroffset = arr[1];
  6.                 document.forms[0].pageroffset.value = pageroffset;
  7.                 $('currentPageNumber').value =(parseInt(pageroffset)+20)/20;
  8.                 document.forms[0].submit();
  9.         }
复制代码
可以知道提交表单,分页相关重要的字段是currentPageNumber 和pageroffset,2者通过test函数可以知道关系是:pageroffset=(currentPageNumber-1)*20,
currentPageNumber是页码,pageroffset是偏移,

这样第2页分页地址是
  1. http://www.cde.org.cn/schedule/cata.do?method=list&year=2011&drugtype=&applytype=&acceptid=&drugname=&currentPageNumber=2&pageMaxNumber=20&max=223&pageroffset=20
复制代码


我试过不设置pageroffset,发现页面的当前页码不会变,但内容是正确的;而路过设置为pageroffset=(currentPageNumber-1)*20这样的关系,内容正确同时,红色的当前页码也是正确的

另外由于列表既是内容页,表格数据很多,用循环的话,测试难以猜到数据,所以我直接把一页内容包含采集了,显得很乱


分页地址需要借助其他工具生成,以满足pageroffset=(currentPageNumber-1)*20的关系
其他的表单选项,修改对应的字段就可以达到不同的搜索条件了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-4-11 13:06

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表