火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5292|回复: 7

高难度采集地址提取,一般人做不了,高手请进!

[复制链接]
发表于 2010-5-31 11:31:00 | 显示全部楼层 |阅读模式
1火车车厢
本帖最后由 martin100 于 2010-5-31 14:14 编辑
  1.     <div class="pager">
  2.     <table cellpadding="3" cellspacing="1" border="0" class="PagerContainerTable">
  3.         <tr>
  4.                 <td class="PagerCurrentPageCell"><span class="PagerHyperlinkStyle"  title="Showing Results 1 到 12 总条数 237" >
  5. <strong> 1 </strong></span>
  6. </td>
  7. <td class="PagerOtherPageCells">
  8. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','2')"  title="显示结果 13 到 24 总条数 237" > 2 </a>
  9. </td>
  10. <td class="PagerOtherPageCells">
  11. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','3')"  title="显示结果 25 到 36 总条数 237" > 3 </a>
  12. </td>
  13. <td class="PagerOtherPageCells">
  14. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','4')"  title="显示结果 37 到 48 总条数 237" > 4 </a>
  15. </td>
  16. <td class="PagerOtherPageCells">
  17. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','5')"  title="显示结果 49 到 60 总条数 237" > 5 </a>
  18. </td>
  19. <td class="PagerOtherPageCells">
  20. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','6')"  title="显示结果 61 到 72 总条数 237" > 6 </a>
  21. </td>
  22. <td class="PagerOtherPageCells">
  23. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','7')"  title="显示结果 73 到 84 总条数 237" > 7 </a>
  24. </td>
  25. <td class="PagerOtherPageCells">
  26. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','8')"  title="显示结果 85 到 96 总条数 237" > 8 </a>
  27. </td>
  28. <td class="PagerOtherPageCells">
  29. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','9')"  title="显示结果 97 到 108 总条数 237" > 9 </a>
  30. </td>
  31. <td class="PagerOtherPageCells">
  32. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','10')"  title="显示结果 109 到 120 总条数 237" > 10 </a>
  33. </td>
  34. <td class="PagerOtherPageCells">
  35. <a class="PagerHyperlinkStyle" href="javascript:__doPostBack('Pager','2')" title=" 下一页 2"> 下一页 </a>
  36. </td>
  37.         </tr>
  38. </table>
  39.     </div>  
复制代码
这个网站是采用js分页,采集地址不变化,一般的提取肯定不行,我想是不是正则可以,希望高手指点一下,给个可行思路!谢谢!采集原址:http://www.ysjiage.com/q.aspx?city=7&pos=&printService=

发表于 2010-5-31 11:55:03 | 显示全部楼层

用POST方式来采
 楼主| 发表于 2010-5-31 12:10:31 | 显示全部楼层
用POST方式来采
月白 发表于 2010-5-31 11:55

首先谢谢你,不过我不太明白用POST怎么采集,你有成功采集过此类网站吗?
发表于 2010-5-31 13:53:50 | 显示全部楼层
用POST方式获取分页就可以了,论坛好像有教程
 楼主| 发表于 2010-5-31 14:12:27 | 显示全部楼层
大功告成,在这里万分感谢aven的[新教程] Post列表页采集超详细教程(附工具)教程:http://bbs.locoy.com/viewthread.php?tid=30555&highlight=
 楼主| 发表于 2010-5-31 14:12:55 | 显示全部楼层
回复 4# zjyk1984


    谢谢!搞定了!
发表于 2010-5-31 16:08:51 | 显示全部楼层
呵呵,不客气

只要肯学,一切都变得容易


http://bbs.locoy.com/spider-50802-1-1.html
发表于 2010-6-1 04:36:30 | 显示全部楼层
谢谢楼主分享``不错`!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-6-21 02:39

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表