火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2936|回复: 5

请问我采集下来的文章,保存的txt格式,但是含有很多代码,请问怎么不采集这些代码?

[复制链接]
发表于 2013-2-1 11:03:39 | 显示全部楼层 |阅读模式
我采集一个网站的文章,想保存下来成txt格式,用gb2312格式保存的话只有  [标签:内容][标签:标题]  这样的内容。
后来用utf8可以保存了,可是文章里有不少穿插的html代码,请问采集的时候怎样不采集这些代码呢?

还有我想上传我的ljbo文件,为什么附件添加里看不到文件呢?明明提示支持的啊?
发表于 2013-2-1 11:45:38 | 显示全部楼层
采集的时候把HTML排除掉就行了
发表于 2013-2-1 13:31:48 | 显示全部楼层
打包上传 本身就不支持上传的
 楼主| 发表于 2013-2-1 14:17:20 | 显示全部楼层
303718 发表于 2013-2-1 11:45
采集的时候把HTML排除掉就行了

请问哪里有html排除啊?我找了很久都没找到,我用的7.6版本的。也搜索过,但是那个贴好像和我的版本不一样,这个版本我不知道怎么弄呢
 楼主| 发表于 2013-2-1 14:17:56 | 显示全部楼层
leejunji 发表于 2013-2-1 13:31
打包上传 本身就不支持上传的

打包上传,我怎么都没见过这个词呢......
发表于 2013-2-1 16:31:48 | 显示全部楼层
mario2891 发表于 2013-2-1 14:17
打包上传,我怎么都没见过这个词呢......

额 压缩包知道不~~~~~~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-10 00:56

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表