vus520 发表于 2007-11-5 01:27:58

成功采集 java控制的分页列表怎么采集啊?!

http://bbs.locoy.com/spider-20003-1-1.html


正则提取方法



这里提交的参数是隐藏的,我们看看代码就知道


<input type="hidden" value="" name="subject_id" />
    <input type="hidden" value="" name="type_name" />
               <input type="hidden" name="shownew" value="" />
               <input type="hidden" name="class_id" value="286" />
      <input type="hidden" name="thispage" value="2" />


唯一遗憾的是,不能自动获取到 name="class_id" value="286" />这里的参数!!!

丛林虫虫 发表于 2007-11-5 08:50:26

哈。谢谢啊!!嘴一个!%ali13ls 。哈。哈 (both manali14ls )

1860com 发表于 2007-11-5 09:03:41

隐藏参数是知道 就是不知道 为什么有时候连接的参数是用 ? 有时候是用&

能解释下吗 &这个是连接符?这个是 什么

asp代码不懂 有时候明明知道问题在这个地方 不知道这么解决

上次?Submit=+++%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%C4+++&htmlpath= 你解决的 唉我知道在那个地方 就是不知道这么解 脚本不懂

火车尾巴 发表于 2007-11-5 09:50:24

&指连接变量参数,?指执行某个动态页的动作,这个?后的动作可以带多个&来串连变量。
%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%这些字符,你需要找工具反encode出原来的字符。

vus520 发表于 2007-11-5 11:26:50

原帖由 1860com 于 2007-11-5 09:03 发表 http://bbs.locoy.com/images/common/back.gif
隐藏参数是知道 就是不知道 为什么有时候连接的参数是用 ? 有时候是用&

能解释下吗 &这个是连接符?这个是 什么

asp代码不懂 有时候明明知道问题在这个地方 不知道这么解决

上次?Submit=+++%B5%E3%D5%E2% ...

Submit=+++%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%C4+++
其实就是提交啦!
有时候写程序,也会看有没有这个参数,简单的看看有没有经过提交.基本上可以省略,用处不大!

vus520 发表于 2007-11-5 11:27:49

原帖由 火车尾巴 于 2007-11-5 09:50 发表 http://bbs.locoy.com/images/common/back.gif
&指连接变量参数,?指执行某个动态页的动作,这个?后的动作可以带多个&来串连变量。
%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%这些字符,你需要找工具反encode出原来的字符。
:ali10ls

freeall 发表于 2007-11-5 17:01:13

有点意思ali13ls

1860com 发表于 2007-11-5 18:59:18

Submit=+++点击阅读+++那个字符串我知道是 为什么要加上 三个+ 我用一个为什么不行

关键代码其实我知道是那个意思 也是在那个地方解决 就是不知道 怎么弄:ali0ls没脚本知识...

[ 本帖最后由 1860com 于 2007-11-5 19:05 编辑 ]

vus520 发表于 2007-11-5 20:59:09

回复 8楼 的帖子

+++其实可以省略的,不知道你发现没有!
我记得这是从他源码中找到的,这三个+应该是没有意义的!
页: [1]
查看完整版本: 成功采集 java控制的分页列表怎么采集啊?!