发新话题
打印

[已解决] 成功采集 java控制的分页列表怎么采集啊?!

成功采集 java控制的分页列表怎么采集啊?!

http://bbs.locoy.com/spider-20003-1-1.html


正则提取方法



这里提交的参数是隐藏的,我们看看代码就知道
复制内容到剪贴板
代码:

<input type="hidden" value="" name="subject_id" />
    <input type="hidden" value="" name="type_name" />
               <input type="hidden" name="shownew" value="" />
               <input type="hidden" name="class_id" value="286" />
      <input type="hidden" name="thispage" value="2" />
唯一遗憾的是,不能自动获取到 name="class_id" value="286" />这里的参数!!!
附件: 您所在的用户组无法下载或查看附件
火车采集器商业版 咨询、购买、售后支持等 :
火车采集器2008版系列教程正在陆续发布中 :  点击观看
提供高难度采集技术支持,完美实现全站转移,多栏目自动更新
火车采集器采集规则定制:[50元/条,质量保证]
火车采集器发布模块定制:[80元/条,质量保证]
火车采集器程序接口定制:[按程序难度议价,200起]
织梦图片集自动发布模块:[100元/个,自动分析图片代码、远程下载图片]
支持支付宝淘宝安全交易:Q Q: 130775 Mail:vu520@163.com ->查看更多联系方式

TOP

哈。谢谢啊!!嘴一个!% 。哈。哈 (both man )

TOP

隐藏参数是知道 就是不知道 为什么有时候连接的参数是用 ? 有时候是用&

能解释下吗 &这个是连接符  ?这个是 什么

asp代码不懂 有时候明明知道问题在这个地方 不知道这么解决

上次?Submit=+++%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%C4+++&htmlpath= 你解决的 唉我知道在那个地方 就是不知道这么解 脚本不懂

TOP

&指连接变量参数,?指执行某个动态页的动作,这个?后的动作可以带多个&来串连变量。
%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%这些字符,你需要找工具反encode出原来的字符。

TOP

引用:
原帖由 1860com 于 2007-11-5 09:03 发表
隐藏参数是知道 就是不知道 为什么有时候连接的参数是用 ? 有时候是用&

能解释下吗 &这个是连接符  ?这个是 什么

asp代码不懂 有时候明明知道问题在这个地方 不知道这么解决

上次?Submit=+++%B5%E3%D5%E2% ...
Submit=+++%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%C4+++
其实就是提交啦!
有时候写程序,也会看有没有这个参数,简单的看看有没有经过提交.基本上可以省略,用处不大!
火车采集器商业版 咨询、购买、售后支持等 :
火车采集器2008版系列教程正在陆续发布中 :  点击观看
提供高难度采集技术支持,完美实现全站转移,多栏目自动更新
火车采集器采集规则定制:[50元/条,质量保证]
火车采集器发布模块定制:[80元/条,质量保证]
火车采集器程序接口定制:[按程序难度议价,200起]
织梦图片集自动发布模块:[100元/个,自动分析图片代码、远程下载图片]
支持支付宝淘宝安全交易:Q Q: 130775 Mail:vu520@163.com ->查看更多联系方式

TOP

引用:
原帖由 火车尾巴 于 2007-11-5 09:50 发表
&指连接变量参数,?指执行某个动态页的动作,这个?后的动作可以带多个&来串连变量。
%B5%E3%D5%E2%C0%EF%D4%C4%B6%C1%C8%AB%CE%这些字符,你需要找工具反encode出原来的字符。
火车采集器商业版 咨询、购买、售后支持等 :
火车采集器2008版系列教程正在陆续发布中 :  点击观看
提供高难度采集技术支持,完美实现全站转移,多栏目自动更新
火车采集器采集规则定制:[50元/条,质量保证]
火车采集器发布模块定制:[80元/条,质量保证]
火车采集器程序接口定制:[按程序难度议价,200起]
织梦图片集自动发布模块:[100元/个,自动分析图片代码、远程下载图片]
支持支付宝淘宝安全交易:Q Q: 130775 Mail:vu520@163.com ->查看更多联系方式

TOP

有点意思

TOP

Submit=+++点击阅读+++  那个字符串我知道是 为什么要加上 三个+ 我用一个为什么不行

关键代码其实我知道是那个意思 也是在那个地方解决 就是不知道 怎么弄没脚本知识...

[ 本帖最后由 1860com 于 2007-11-5 19:05 编辑 ]

TOP

回复 8楼 的帖子

+++其实可以省略的,不知道你发现没有!
我记得这是从他源码中找到的,这三个+应该是没有意义的!
火车采集器商业版 咨询、购买、售后支持等 :
火车采集器2008版系列教程正在陆续发布中 :  点击观看
提供高难度采集技术支持,完美实现全站转移,多栏目自动更新
火车采集器采集规则定制:[50元/条,质量保证]
火车采集器发布模块定制:[80元/条,质量保证]
火车采集器程序接口定制:[按程序难度议价,200起]
织梦图片集自动发布模块:[100元/个,自动分析图片代码、远程下载图片]
支持支付宝淘宝安全交易:Q Q: 130775 Mail:vu520@163.com ->查看更多联系方式

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.244185 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-23 06:15 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档