用火车头后的手记.
火车头采集器真的是一很不错的采集工具.在总体设计上还是不错.但唯一不足的地方就是在过滤上.,目前做站都是讲究W3标准,如果一个HTML语言没过滤好.那就会造成整个页面出问题.所以在采集过滤上的要求还是要高一些.目前还分大小写,还有过滤也会有经常出BUG,<div cas="xxx">这个来源的页面是<div class="xxx">我都不知道为什么有的会变成这样.还有现在的CMS基本上都自带远程上传图片.上传图片也只能用在论坛里.
[ 本帖最后由 weq 于 2006-12-4 22:11 编辑 ] o 火车还在努力改进呢,大家支持他
页:
[1]