老年轻 发表于 2009-10-18 16:28:13

多页采集百度相关搜索出现乱码

问题描述如下:

比如采集A站,我们可以通过开始区域<title>,结束区域</title>.来分离得到其标题内容吧?

然后我们在多页设置里设置:

http://www.baidu.com/s?wd=关键字

然后分离相关搜索的开始结束区域就得到了相关搜索关键字.

问题是我得到的是乱码.

貌似问题出现在URL里出现的关键字是中文的.

我以前成功过,但忘了以前的操作了.
页: [1]
查看完整版本: 多页采集百度相关搜索出现乱码