随意徘徊 发表于 2013-7-27 12:20:05

多级网页地址的替换问题

在    http://www.ctaxnews.com.cn/xinwen/wxw/index.html 中,如何将

<td class="textfont"><a href="./201304/t20130426_1594409.htm">【四川省国税局向灾区划拨2万元党费】 </a></td>
替换成
http://www.ctaxnews.com.cn/xinwen/wxw/201304/t20130426_1594409.htm
即:
                <td class="textfont"><a href="./201304/t20130426_1594409.htm">【四川省国税局向灾区划拨2万元党费】 </a></td>
http://www.ctaxnews.com.cn/xinwen/wxw/201304/t20130426_1594409.htm 看了许多帖子,关于这一点一直没看到详细说明。多谢。

303718 发表于 2013-7-27 12:26:21

用自定义连接采集就行了

随意徘徊 发表于 2013-7-27 12:50:17

303718 发表于 2013-7-27 12:26 static/image/common/back.gif
用自定义连接采集就行了

非常感谢,您说的“自定义链接”是指“手动填写链接”吗?

随意徘徊 发表于 2013-7-27 13:04:57

关键是我用Xpath只能获取一条网址:(

随意徘徊 发表于 2013-7-27 13:17:27

搞了半天,自己弄好了{:soso_e113:}
页: [1]
查看完整版本: 多级网页地址的替换问题