火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3254|回复: 5

2009比2008还差,提取缩略图问题

[复制链接]
发表于 2009-4-23 21:36:52 | 显示全部楼层 |阅读模式
2008有提取第一张图片位缩略图的功能的,2009反而没有,晕死啊,有没2009降级到2008的办法呢
发表于 2009-4-26 00:57:05 | 显示全部楼层
我反映的BUG也是提取缩略图问题:我写好的规则,在测试的时候,显示图片能成功下载,而真正运行任务的时候,并没有图片下载,无论我是选取了“相对地址补全为绝对地址”都不能下载,为此,我专门在搜索结果加了“<img src=>”的标记才能下载,我初初使用火车头,不知是否我不会使用,还是软件的BUG,谢谢。为火车头的辛勤劳动表示敬意!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2009-5-14 10:35:04 | 显示全部楼层
这个功能越改越差
发表于 2009-5-14 10:50:10 | 显示全部楼层
因为2009提取缩列图的功能是在发布接口那里,发布接口具有灵活性,可以针对不同的网站程序更改参数,比如DEDE、比如PHP168,比如PC等等,在网站发布接口更改参数是最准确的提取缩列图,建议各位还是多多参详,别抱怨了,哈哈。
比如DEDE发布接口,把缩列图的标签从0改成1就可以了,明白了吧。
发表于 2009-5-14 15:03:57 | 显示全部楼层
火车软件一直认为 <img src="*****">才是图片,他不认为 *****是图片的。道理上很简单的,因为 *****有可能是一个普通的网址,也可能是一个普通的在页面上显示的文字,而不是网址。这是火车软件考虑的周详之处,而不是bug。

可能有人质疑,那后面的结尾是jpg或者gif 难道不是图片吗?是的,但是图片的样式太多了,比如tiff格式,png格式,还有一些根本没有后缀的,如果这样一一扫描比对,只会消耗你的系统资源,而且图片格式太多了,所以不可能内置穷举所有样式的图片。

而只要在网页上以图片格式显示,必然是以 <img src="*****"> 形式出现的。这样软件的工作量大为简化,你的采集速度也能上去,也更加周全。
发表于 2009-5-14 15:24:37 | 显示全部楼层
我一般都不采集缩列图,会影响速度,直接把采集过来的图片在发布的时候设置第一张为缩列图就OK了
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 13:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表