为什么在采集的时候把采集内容的html语法去掉拉
采集源的内容格式都是编辑好了,为什么采集入库的时候就把原来的html语法全过滤掉拉,在采集的时候html标签排除一项我一个都没有选啊,[ 本帖最后由 fxlijun 于 2006-11-2 21:17 编辑 ] 你用了ubb格式的 楼上说的对,采集到的图片地址都是这样格式的, 但我很多地方都是用的默认的,并没见着有ubb格式和html格式的选择啊, 楼上能否在提示以下在哪选择格式,多谢先 我发现只有在web在线发布的时候有个ubb是否转换的问题,并且默认选择ubb模式, 而我只是采集,不做发布,我看保存采集内容的数据库SpiderResult.mdb里内容全是ubb格式,
这个火车头采集是不是只采集论坛,所以默认用ubb模式?而我采集新闻,入foosun4的新闻库,要html格式,不要ubb模式 俺也觉得很不方便,本来好好的html,给搞成啥格式都没有了,图表什么的全乱套了
应该在编辑采集规则标签的时候给个选项才好。 同感。 原帖由 insun 于 2006-11-2 18:23 发表
你用了ubb格式的
怎么才是html格式,怎么设置? LocoySpiderV3.exe我在这个程序里面改了一下,现在可以了 楼上的改哪里?
页:
[1]