jinsede2 发表于 2013-2-3 20:22:22

作者采集下来,但出不来

免费版,采集pw论坛,比以前采集过的乱码多些,不知道对方是不是用了防止采集的措施。采集测试作者都可以采集,就是名字前面多一个空格。但是发布的时候作者都变成回复用户名1.2.3.4这样的了,请问高手怎么回事。

303718 发表于 2013-2-4 08:41:37

如果只是多了空格就好办了

jinsede2 发表于 2013-2-4 11:17:58

html标签排除都已经勾选,不过还是一样,我采集别的pw或者discuz都没问题,就是这个pw论坛http://www.jingyejj.com/read-htm-tid-1387.html不行


下面是采集到的数据,每个用户名前面都自动生成一个空格。
【作者】:爱恋1901||| 淘客小霸王||| 摩崖||| 流年未逝||| 阿笨猫||| 友情久久礼品||| 流年未逝||| yznj
【时间】:2012-12-22 17:20:20||| 2012-12-22 17:51:44||| 2012-12-23 16:22:18||| 2012-12-24 10:18:35||| 2012-12-24 15:40:25||| 2012-12-24 16:57:01||| 2012-12-25 15:57:19||| 2013-02-02 23:14:42

303718 发表于 2013-2-4 12:16:18

那你把那那个空格替换掉就好了

jinsede2 发表于 2013-2-4 13:19:21

刚刚试试了还是一样的不行

xmwebi 发表于 2013-2-4 18:14:37

我是图片地址不出来

303718 发表于 2013-2-4 18:47:30

很明显你采的内容的空格都没有排除掉

zhoushanwengbin 发表于 2013-2-5 13:05:10

我采集到了论坛回帖人的头像,可是发布后没显示
页: [1]
查看完整版本: 作者采集下来,但出不来