luling0754 发表于 2011-2-22 23:19:47

采集百度时候有疑问 麻烦大家帮帮忙

采集搜索页的 相关搜索关键词 需要替换链接 由于每个搜索页的相关搜索词都不是固定的 我对变量不是很了解 希望大家帮帮我

以 http://www.baidu.com/baidu?cl=3&tn=baidutop10&fr=top1000&wd=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF 为例

开始字符串 <div id="rs"><table cellpadding="0"><tr>
结束字符串 <div id="search">

采集出:<a href="s?wd=%CC%A8%CD%E5%D7%EE%C3%C0%B5%C4%D0%D8%B2%BF&rsp=0&oq=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF&f=1&tn=baidutop10&rsv_ers=xn0">关键词</a> 
其中一段是百度链接 关键词为GBK编码<a href="s?wd=%D7%EE%C3%C0%CF%B4%BD%C5%C3%C3&rsp=6&oq=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF&f=1&tn=baidutop10&rsv_ers=xn0">关键字</a>我想改成<a href="?s=关键词UTF编码">关键词</a>应该怎么内容替换规则

303718 发表于 2011-2-23 17:24:47

把关键词采集下来然后通过标签合并来调到你想要的结果就行了。
页: [1]
查看完整版本: 采集百度时候有疑问 麻烦大家帮帮忙