【有点郁闷】超级不规则地址的采集问题
希望增加一个获取列表自动截取下一页列表源码的功能目前下面这样的列表无法采集
即使设置为内容页最多只可采集32个分页,火车的限制?
<a href="/class/1_1A32.htm" title=首页>首页</a> <a href="/class/1_30_74A5.htm" target="_self" title="上一页"><font face="Webdings">7</font></a><a href="/class/1_25_D2BE.htm" title=上六页><font face=webdings>9</font></a><ahref="/class/1_28_D039.htm" target="_self" title="转到第28页">28</a><ahref="/class/1_29_F866.htm" target="_self" title="转到第29页">29</a><ahref="/class/1_30_74A5.htm" target="_self" title="转到第30页">30</a><ahref="/class/1_31_64E3.htm" target="_self" title="转到第31页"><span>31</span></a><ahref="/class/1_32_5340.htm" target="_self" title="转到第32页">32</a><ahref="/class/1_33_8C41.htm" target="_self" title="转到第33页">33</a><ahref="/class/1_34_C0E6.htm" target="_self" title="转到第34页">34</a><a href="/class/1_37_36FD.htm" title=下六页><font face=webdings>:</font></a> <a href="/class/1_32_5340.htm" target="_self" title="下一页"><font face="Webdings">8</font></a> <a href="/class/1_1121_DDA0.htm" title=末页>末页</a> 楼主用正则试过没有 不懂,请指点一下! 支持火车。。。。历史帖子回顾中。
页:
[1]