indiboy 发表于 2008-3-2 02:32:13

【有点郁闷】超级不规则地址的采集问题

希望增加一个获取列表自动截取下一页列表源码的功能

目前下面这样的列表无法采集

即使设置为内容页最多只可采集32个分页,火车的限制?


<a href="/class/1_1A32.htm" title=首页>首页</a>    <a href="/class/1_30_74A5.htm" target="_self" title="上一页"><font face="Webdings">7</font></a><a href="/class/1_25_D2BE.htm" title=上六页><font face=webdings>9</font></a><ahref="/class/1_28_D039.htm" target="_self" title="转到第28页">28</a><ahref="/class/1_29_F866.htm" target="_self" title="转到第29页">29</a><ahref="/class/1_30_74A5.htm" target="_self" title="转到第30页">30</a><ahref="/class/1_31_64E3.htm" target="_self" title="转到第31页"><span>31</span></a><ahref="/class/1_32_5340.htm" target="_self" title="转到第32页">32</a><ahref="/class/1_33_8C41.htm" target="_self" title="转到第33页">33</a><ahref="/class/1_34_C0E6.htm" target="_self" title="转到第34页">34</a><a href="/class/1_37_36FD.htm" title=下六页><font face=webdings>:</font></a> <a href="/class/1_32_5340.htm" target="_self" title="下一页"><font face="Webdings">8</font></a> <a href="/class/1_1121_DDA0.htm" title=末页>末页</a>

沦陷今生 发表于 2008-3-2 02:44:32

楼主用正则试过没有

indiboy 发表于 2008-3-2 23:17:02

不懂,请指点一下!

lbjyuer 发表于 2016-2-10 09:00:53

支持火车。。。。历史帖子回顾中。
页: [1]
查看完整版本: 【有点郁闷】超级不规则地址的采集问题