(已解决)有些论坛主题采集不到,请问是怎么回事?结果全是一连串的字符
本帖最后由 myangel2000 于 2011-5-4 15:47 编辑有些论坛贴子的主题怎么也采集不到,采集出来全是一连的好长的字符,比如像这个贴子:http://www.zahww.com/thread-2121-1-1.html
采集到的主题的结果就成了:http://www.zahww.com/%c3%bf%d6%dc%d2%bb/%c8%fd/%ce%e5%a3%ba%b0%c4%c3%c5%cb%ae%cc%c1%c5%dc%b2%bd%a3%a8%ca%b1%bc%e4%cf%c2%ce%e718%a3%ba10%b7%d6%a3%a9
请问一下是怎么回事,怎么样解决这样的问题呢? 你好,你选GBK编码采集试试。 和编码有关.................. 我用的就是GBK的编码,内容采集一切正常,就是主题采集有问题! 请提交规则测试一下,或者联系企业qq:800019423 我采集的是下面这个网址:http://www.3366ok.com/html/activity/20110416/25475.shtml
上面的是规则附件! 我在采集好几个论坛的时候都是出现这样的问题! 你试试看看能不能采到标题
哦,原来是这样的。我在文件下载选项里面点了:将相对地址补全为绝对地址,就出现了这种情况,取消之后就可以了,谢谢楼上的朋友!
页:
[1]