发新话题
打印

[3.2版] 【有点郁闷】超级不规则地址的采集问题

【有点郁闷】超级不规则地址的采集问题

希望增加一个获取列表自动截取下一页列表源码的功能

目前下面这样的列表无法采集

即使设置为内容页最多只可采集32个分页,火车的限制?
引用:
<a href="/class/1_1A32.htm" title=首页>首页</a>    <a href="/class/1_30_74A5.htm" target="_self" title="上一页"><font face="Webdings">7</font></a>  <a href="/class/1_25_D2BE.htm" title=上六页><font face=webdings>9</font></a>  <a  href="/class/1_28_D039.htm" target="_self" title="转到第28页">28</a>  <a  href="/class/1_29_F866.htm" target="_self" title="转到第29页">29</a>  <a  href="/class/1_30_74A5.htm" target="_self" title="转到第30页">30</a>  <a  href="/class/1_31_64E3.htm" target="_self" title="转到第31页"><span>31</span></a>  <a  href="/class/1_32_5340.htm" target="_self" title="转到第32页">32</a>  <a  href="/class/1_33_8C41.htm" target="_self" title="转到第33页">33</a>  <a  href="/class/1_34_C0E6.htm" target="_self" title="转到第34页">34</a>  <a href="/class/1_37_36FD.htm" title=下六页><font face=webdings>:</font></a> <a href="/class/1_32_5340.htm" target="_self" title="下一页"><font face="Webdings">8</font></a> <a href="/class/1_1121_DDA0.htm" title=末页>末页</a>

TOP

楼主用正则试过没有
提供高难度采集,全站采集入库服务。
火车采集规则定制:[50/个,质量保证]
火车发布模块定制:[80/个,质量保证]
支付宝安全交易:Yzelvis@gmail.com

QQ:11351936 (人数已满),QQ:494839368 (技术咨询),QQ:948423048 (常年在线)

TOP

不懂,请指点一下!

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.184937 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-9-7 13:46 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档