为什么在采集的时候把采集内容的html语法去掉拉

fxlijun 发表于 2006-11-2 16:40:32

采集源的内容格式都是编辑好了，为什么采集入库的时候就把原来的html语法全过滤掉拉，在采集的时候html标签排除一项我一个都没有选啊，

[ 本帖最后由 fxlijun 于 2006-11-2 21:17 编辑 ]

insun 发表于 2006-11-2 18:23:16

你用了ubb格式的

fxlijun 发表于 2006-11-2 20:59:53

楼上说的对，采集到的图片地址都是这样格式的，但我很多地方都是用的默认的，并没见着有ubb格式和html格式的选择啊，楼上能否在提示以下在哪选择格式，多谢先

fxlijun 发表于 2006-11-2 21:08:41

我发现只有在web在线发布的时候有个ubb是否转换的问题，并且默认选择ubb模式，而我只是采集，不做发布，我看保存采集内容的数据库SpiderResult.mdb里内容全是ubb格式，

这个火车头采集是不是只采集论坛，所以默认用ubb模式？而我采集新闻，入foosun4的新闻库，要html格式，不要ubb模式

hay 发表于 2006-11-5 02:24:12

俺也觉得很不方便，本来好好的html，给搞成啥格式都没有了，图表什么的全乱套了

应该在编辑采集规则标签的时候给个选项才好。

chenson 发表于 2006-11-8 19:12:37

同感。

chenson 发表于 2006-11-8 19:57:38

原帖由 insun 于 2006-11-2 18:23 发表
你用了ubb格式的
怎么才是html格式，怎么设置？

chenson 发表于 2006-11-8 20:50:19

LocoySpiderV3.exe我在这个程序里面改了一下，现在可以了

callzf 发表于 2006-11-9 13:49:01

楼上的改哪里？

页: [1]

火车采集器软件交流官方论坛's Archiver

为什么在采集的时候把采集内容的html语法去掉拉