2009SP4最新的版,有空格网无法采集
列表页的网址 是这种样子<tr><td >· <a href=" /techdoc/install/2009/09/02/1133586.shtml" target="_blank" style="font-size:14px">Upstart启动过程</a></td><td align="right" nowrap>2009-09-02 22:49</td></tr>
得到的网址就是
http://linux.chinaunix.net/techdoc/beginner/ /techdoc/beginner/2008/11/06/1043469.shtml 自已重新组合过滤一下呗{:4_197:}
页:
[1]