darkfire 发表于 2009-10-27 14:34:34

2009SP4最新的版,有空格网无法采集

列表页的网址 是这种样子
<tr><td >· <a href=" /techdoc/install/2009/09/02/1133586.shtml" target="_blank" style="font-size:14px">Upstart启动过程</a></td><td align="right" nowrap>2009-09-02 22:49</td></tr>

得到的网址就是

http://linux.chinaunix.net/techdoc/beginner/ /techdoc/beginner/2008/11/06/1043469.shtml

zjyk1984 发表于 2009-10-27 15:20:30

自已重新组合过滤一下呗{:4_197:}
页: [1]
查看完整版本: 2009SP4最新的版,有空格网无法采集