waterxi 发表于 2007-11-5 11:49:35

回答DZ论坛采集的一些问题

1、DZ6.0能发布了,但发布上去的都是html代码.
问题是发布上去的文章都是html代码,一大片一大片的根本无法正常观看.

无论用html模式,还是ubb形式,都是一大片代码,请问如何解决啊?

http://bbs.locoy.com/spider-19947-1-1.html

答:这个有二个问题,一是在采集的时候必须要选UBB,二是在目标论坛上要设置不支持HTML,若不然会导致这个问题的出现。

2、采集了某论坛,怎么发布也是有回帖的呢?

http://bbs.locoy.com/spider-19837-1-1.html

答:这个问题很经典,经典到是一个设置的问题。打开火车头,“采集内容规则” 左边有个选项,叫“用分隔符连接在上条记录上“,当你选了这个后就不会你有所说的问题啦!

3、关于DZ论坛采集的网址问题
http://bbs.locoy.com/spider-19959-1-1.html

答:这个问题是属于个人不够细心的原因。比如网址:http://www.xxxx.com/viewthread.php?tid=314941&sid=IhHk6o 在采集网址规则中你主要在”文章内容只要包括以下内容“处填入”viewthread.php?tid=(*)“ 再在不得包含中填“page="
另外一种就是静态的DZ,可以这样设置:“thread-(*)-1-1.html”

4、6.0发布回帖和内容并在一起如何解决?

答:这个问题没有仔细研究,但我认为,应该是你修改了“全局设置” “采集发布设置” “循环采集内容的时候用分隔符”  或是,你用的是另外的发布模块。
http://bbs.locoy.com/spider-19792-1-1.html

waterxi 发表于 2007-11-5 11:50:14

大家多多支持哦?:ali11ls

dllan 发表于 2007-11-5 13:52:46

第三点里应该还不得包含lastpost|newpost

VipHero 发表于 2007-11-5 15:13:32

谢谢楼主的回答,但是红字那个部分,按照你说的,还是有的。而且后面那些字符都是虽见的,每次不同,造成火车头会认为是不同网址而重复采集。

VipHero 发表于 2007-11-5 15:14:53

我想怎么设置:
不是网址不得包含,
而是网址虽然包含了,怎么样在设计规则的时候去除掉?这个我还不会。

110120 发表于 2007-11-5 22:59:28

1、DZ6.0能发布了,但发布上去的都是html代码.
问题是发布上去的文章都是html代码,一大片一大片的根本无法正常观看.

无论用html模式,还是ubb形式,都是一大片代码,请问如何解决啊?

http://bbs.locoy.com/spider-19947-1-1.html

答:这个有二个问题,一是在采集的时候必须要选UBB,二是在目标论坛上要设置不支持HTML,若不然会导致这个问题的出现。


按照楼主的方法设置之后,结果还是一样
无论用html模式,还是ubb形式,都是一大片代码

为这个问题搞了一个下午和晚上,觉得火车头的 易用性 实在是有待改进

总之
1、DZ6.0能发布了,但发布上去的都是html代码.
问题是发布上去的文章都是html代码,一大片一大片的根本无法正常观看.
这个问题还没有解决

linty 发表于 2007-11-6 01:38:43

我也想投反对票,第二条,已经勾选了分隔符,仍然一个效果,只不过很不规则,有时候正常分开,有时候不正常,第4条也有问题,火车用很久了,算是忠实分子,估计一些低级错不是不会犯的,和上面一样,有时正常有时候有问题,还有一个大问题,回复也有标题,这个非常想听见解,从来没人解答过,另外,希望给楼住加分,难得有人回答一下问题

linty 发表于 2007-11-21 22:15:07

楼上你个白痴,想做采集器,得有一点奉献精神,火车可是大部分功能免费的,你上来就要人掏银子,谁知道你的好用不好用?:lol

kafeier 发表于 2007-12-7 11:37:19

网址采集成功. 谢谢主
页: [1]
查看完整版本: 回答DZ论坛采集的一些问题