火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6533|回复: 8

回答DZ论坛采集的一些问题

[复制链接]
发表于 2007-11-5 11:49:35 | 显示全部楼层 |阅读模式
1、DZ6.0能发布了,但发布上去的都是html代码.
问题是发布上去的文章都是html代码,一大片一大片的根本无法正常观看.

无论用html模式,还是ubb形式,都是一大片代码,请问如何解决啊?

http://bbs.locoy.com/spider-19947-1-1.html

答:这个有二个问题,一是在采集的时候必须要选UBB,二是在目标论坛上要设置不支持HTML,若不然会导致这个问题的出现。

2、采集了某论坛,怎么发布也是有回帖的呢?

http://bbs.locoy.com/spider-19837-1-1.html

答:这个问题很经典,经典到是一个设置的问题。打开火车头,“采集内容规则” 左边有个选项,叫“用分隔符连接在上条记录上“,当你选了这个后就不会你有所说的问题啦!

3、关于DZ论坛采集的网址问题
http://bbs.locoy.com/spider-19959-1-1.html

答:这个问题是属于个人不够细心的原因。比如网址:http://www.xxxx.com/viewthread.php?tid=314941&sid=IhHk6o 在采集网址规则中你主要在”文章内容只要包括以下内容“处填入”viewthread.php?tid=(*)“ 再在不得包含中填“page="
另外一种就是静态的DZ,可以这样设置:“thread-(*)-1-1.html”

4、6.0发布回帖和内容并在一起如何解决?

答:这个问题没有仔细研究,但我认为,应该是你修改了“全局设置” “采集发布设置” “循环采集内容的时候用分隔符”  或是,你用的是另外的发布模块。
http://bbs.locoy.com/spider-19792-1-1.html

评分

1

查看全部评分

 楼主| 发表于 2007-11-5 11:50:14 | 显示全部楼层
大家多多支持哦?
发表于 2007-11-5 13:52:46 | 显示全部楼层
第三点里应该还不得包含lastpost|newpost
发表于 2007-11-5 15:13:32 | 显示全部楼层
谢谢楼主的回答,但是红字那个部分,按照你说的,还是有的。而且后面那些字符都是虽见的,每次不同,造成火车头会认为是不同网址而重复采集。
发表于 2007-11-5 15:14:53 | 显示全部楼层
我想怎么设置:
不是网址不得包含,
而是网址虽然包含了,怎么样在设计规则的时候去除掉?这个我还不会。
发表于 2007-11-5 22:59:28 | 显示全部楼层
1、DZ6.0能发布了,但发布上去的都是html代码.
问题是发布上去的文章都是html代码,一大片一大片的根本无法正常观看.

无论用html模式,还是ubb形式,都是一大片代码,请问如何解决啊?

http://bbs.locoy.com/spider-19947-1-1.html

答:这个有二个问题,一是在采集的时候必须要选UBB,二是在目标论坛上要设置不支持HTML,若不然会导致这个问题的出现。


按照楼主的方法设置之后,结果还是一样
无论用html模式,还是ubb形式,都是一大片代码

为这个问题搞了一个下午和晚上,觉得火车头的 易用性 实在是有待改进

总之
1、DZ6.0能发布了,但发布上去的都是html代码.
问题是发布上去的文章都是html代码,一大片一大片的根本无法正常观看.

这个问题还没有解决
发表于 2007-11-6 01:38:43 | 显示全部楼层
我也想投反对票,第二条,已经勾选了分隔符,仍然一个效果,只不过很不规则,有时候正常分开,有时候不正常,第4条也有问题,火车用很久了,算是忠实分子,估计一些低级错不是不会犯的,和上面一样,有时正常有时候有问题,还有一个大问题,回复也有标题,这个非常想听见解,从来没人解答过,另外,希望给楼住加分,难得有人回答一下问题
发表于 2007-11-21 22:15:07 | 显示全部楼层
楼上你个白痴,想做采集器,得有一点奉献精神,火车可是大部分功能免费的,你上来就要人掏银子,谁知道你的好用不好用?
发表于 2007-12-7 11:37:19 | 显示全部楼层
网址采集成功. 谢谢主
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-3-31 08:24

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表