火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: zhouchanglin

js post网站专区

[复制链接]
发表于 2011-7-18 15:47:35 | 显示全部楼层
求教个内容页面里部分内容在其他页面中,但是这个页面后面跟个Math随即数做参数,这该如呢办呢?小菜鸟请高手指教。

<script type="text/javascript">
    jQuery.noConflict();
    jQuery(document).ready(function() {
      var url = "/members/ashx/GetCorpLinkInfo.ashx?id=569851&rnd=" + Math.random();      jQuery.getJSON(url, function(data) {
        if (parseInt(data.hidelink) == 1) {
          jQuery("#divLinkInfo").hide();
          jQuery("#hideLinkTip").show();
        }
发表于 2011-7-19 09:46:20 | 显示全部楼层
http://www.hbsc.cn/members/zw_120465.html
联系方式  咋采求高手指教下!
 楼主| 发表于 2011-7-19 13:01:21 | 显示全部楼层
回复 184# cj009


    登陆后,联系方式就可以看到了,火车头有登陆采集的 一些教程,你搜下就明白了
 楼主| 发表于 2011-7-19 13:28:22 | 显示全部楼层
本帖最后由 zhouchanglin 于 2011-7-19 13:29 编辑

回复 182# hctsjw


    应该是相对地址识别的问题,你采用的是自动识别吧

它地址是
  1. <h4><a href="140566/891345150307.shtml"
复制代码
相对于当前目录http://it.tom.com/list/159202_auto-6181_1/,得到的地址应该是http://it.tom.com/list/159202_au ... /891345150307.shtml,不知道值么回事,源码里显示的却是http://it.tom.com/140566/891345150307.shtml

采集方法:
自定义网址:
脚本:
  1. <h4><a href="[参数]"
复制代码
实际连接:
  1. http://it.tom.com/[参数1]
复制代码
相对地址与平常不同的原因:源码里看到了
  1. <base target="_blank" href="http://it.tom.com/" />
复制代码
,百度后知道它的作用是:规定页面中所有相对链接的基准 URL。,所以会是这样的连接
 楼主| 发表于 2011-7-19 14:28:39 | 显示全部楼层
回复 176# zwxuan

点击页码可以知道触发SearchSubmit(3)
  1. <a href="javascript:SearchSubmit(3);" class="p_num">3</a>
复制代码
SearchSubmit(page)
  1. function SearchSubmit(page){document.searchform.page.value=page;document.searchform.submit();}
复制代码
知道是接收页码,设置为page值,然后提交searchform表单

searchform表单
  1. :<form name=searchform method=post action=chushoulist.html onsubmit=SearchSubmit(document.searchform.pageno.value)><input type=hidden name=page>略去部分代码。。。。。。。。。。。<input type=button class="p_input" value=go onclick=SearchSubmit(document.searchform.pageno.value)><input class="p_input" type="text" name="pageno">页</a></div><input type=hidden name=qy value="">
  2. <input type=hidden name=dz value="">
  3. <input type=hidden name=hx value="">
  4. <input type=hidden name=mj1 value="">
  5. <input type=hidden name=mj2 value="">
  6. <input type=hidden name=jg1 value="">
  7. <input type=hidden name=jg2 value="">
  8. <input type=hidden name=cb value="">
  9. <input type=hidden name=flag value="">
  10. <input type=hidden name=djrq value="">
  11. <input type=hidden name=zjid value="">
  12. <input type=hidden name=jmid value="">
  13. <input type=hidden name=jznd value="">
  14. <input type=hidden name=zxnd value="">
  15. <input type=hidden name=lc1 value="">
  16. <input type=hidden name=lc2 value="">
  17. <input type=hidden name=lc value="">
  18. <input type=hidden name=lcwz value="">
  19. <input type=hidden name=fwss value="">
  20. <input type=hidden name=hj value="">
  21. <input type=hidden name=cx value="">
  22. </form>
复制代码
从表单知道提交地址http://house.qingdaonews.com/ershou/chushoulist.html,post数据:把表单各个必要字段&连接,post给这个地址,至于一些其他的字段,是对应那个搜索表单AN的,当搜索后,这些字段会被赋予特定的值,根据用户的查询条件设置的,所以不同的查询可以修改相应字段,而page就是代表页码的字段

规则:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2011-7-19 14:31:22 | 显示全部楼层
回复 183# cj009


    多页获取那个可以获得想要信息的页面,然后采集多页就可以了,随机数应该没有什么影响
发表于 2011-7-21 11:06:33 | 显示全部楼层
回复 188# zhouchanglin

大侠请帮忙给看看吧。随即数有关系的。
http://www.hbsc.cn/members/ashx/GetCorpLinkInfo.ashx?id=912605&rnd=0.20451843188013052
没有rnd=   不行滴:-(
发表于 2011-7-28 17:43:36 | 显示全部楼层
http://www.cde.org.cn/schedule/cata.do?method=list  里边的 在审品种目录浏览\受理品种目录浏览都要采集  能采集吗? 我用他的分页地址试了试,当前所在第几页变了,但是里边的内容一直没变
 楼主| 发表于 2011-8-4 17:01:01 | 显示全部楼层
回复 190# 纵揽


   post数据:
  1. statenow=1&year=2011&drugtype=&applytype=&acceptid=&drugname=&currentPageNumber=9&pageMaxNumber=20&max=200&pageroffset=160&pagenum=
复制代码
页码部分无法设置
currentPageNumber=9 --------------页码
pageroffset=160---------------页码*20-20,无法统一,做不到

除非用php模拟post,生成分页页面,再导入火车头,另外没有内容页,所以还是循环麻烦的很

到不路一页一页的复制
发表于 2011-8-6 16:44:01 | 显示全部楼层
求老大教下:58上的求职简历,联系方式,获取不到源码,多页采集做好了,可就是获取不到电话。好像是多页没有cookie
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-19 02:17

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表