myangel2000 发表于 2011-4-21 15:43:04

(已解决)有些论坛主题采集不到,请问是怎么回事?结果全是一连串的字符

本帖最后由 myangel2000 于 2011-5-4 15:47 编辑

有些论坛贴子的主题怎么也采集不到,采集出来全是一连的好长的字符,比如像这个贴子:http://www.zahww.com/thread-2121-1-1.html
采集到的主题的结果就成了:http://www.zahww.com/%c3%bf%d6%dc%d2%bb/%c8%fd/%ce%e5%a3%ba%b0%c4%c3%c5%cb%ae%cc%c1%c5%dc%b2%bd%a3%a8%ca%b1%bc%e4%cf%c2%ce%e718%a3%ba10%b7%d6%a3%a9

请问一下是怎么回事,怎么样解决这样的问题呢?

303718 发表于 2011-4-21 21:38:18

你好,你选GBK编码采集试试。

zyj33 发表于 2011-4-23 16:38:48

和编码有关..................

myangel2000 发表于 2011-5-4 08:43:41

我用的就是GBK的编码,内容采集一切正常,就是主题采集有问题!

wxl08 发表于 2011-5-4 10:06:10

请提交规则测试一下,或者联系企业qq:800019423

myangel2000 发表于 2011-5-4 13:10:28

我采集的是下面这个网址:http://www.3366ok.com/html/activity/20110416/25475.shtml

上面的是规则附件!

myangel2000 发表于 2011-5-4 13:19:44

我在采集好几个论坛的时候都是出现这样的问题!

303718 发表于 2011-5-4 14:25:55

你试试看看能不能采到标题

myangel2000 发表于 2011-5-4 15:46:46

哦,原来是这样的。我在文件下载选项里面点了:将相对地址补全为绝对地址,就出现了这种情况,取消之后就可以了,谢谢楼上的朋友!
页: [1]
查看完整版本: (已解决)有些论坛主题采集不到,请问是怎么回事?结果全是一连串的字符