火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 8061|回复: 12

加强对图库采集的支持

[复制链接]
发表于 2010-2-6 04:02:31 | 显示全部楼层 |阅读模式
采集后的数据
<img src="XXX.jpg" />
入库的数需要数据
{dede:img ddimg='XXX-lp.jpg'} XXX.jpg {/dede:img}
入库是DEDE图集
问题来了,如果<img src="XXX.jpg" />入库DEDE就不认。如果替换成{dede:img ddimg='XXX-lp.jpg'} XXX.jpg {/dede:img}火车头又下载不到图
片。
本人想了个办法解决
使用两个标签同时采集同一内容,一个标签采集用来下载图片,另一个采集之后替换成DEDE格式用来入库。这是解决方法。但使用不久又出现一个新问题。这样采集由于图片量比较大,难免有图片重名的情况发生。火车头对重名是直接复盖的。
试过用自增ID方法解决。重名问题解决了。由于用了自增ID重命名使得两个标签采集得到的文件名不一样。就成了图片名和入库数据不一致

只要火车头对处理流程调换一下就能解决
1、采集图片地址<img src="XXX.jpg" />
2、下载图片
3、替换处理采集的数据
4、入库

第二加入多标签之间的相互调用,同时能对调用的数据又一次进行采集、替换、除排等操作。实现需要PHP接口才能做的功能在火车上一样做到
发表于 2010-2-6 09:03:05 | 显示全部楼层
DEDE 图库 最好用 web发布, 这样可以自动识别图片了

另外,非 img 标签下下载图片 , 使用文件下载就可以了
 楼主| 发表于 2010-2-6 09:43:14 | 显示全部楼层
本帖最后由 jmkp100 于 2010-2-6 09:44 编辑
DEDE 图库 最好用 web发布, 这样可以自动识别图片了

另外,非 img 标签下下载图片 , 使用文件下载就可以了 ...
都市乞丐 发表于 2010-2-6 09:03



    WEB不能发布的。图片量大,会造成PHP脚本超时。下载方面不成问题。问题是变成DEDE的标签。变成DEDE标签后用文件下载也不能识别到。唯一方法就是火车的处理流程调一下就可以了。
发表于 2010-2-6 11:34:07 | 显示全部楼层
用发布接口这根本不是问题
 楼主| 发表于 2010-2-6 16:17:59 | 显示全部楼层
用发布接口这根本不是问题
aven 发表于 2010-2-6 11:34



    用接口很说不过去。还不如全用接口好了。火车头就是易用、方便才多人用。几个热门的动态网站程序都支持不好还说什么专业采集采。如果是一些自己开发的,或比较冷门的程序使用接口去采集我是没话说的。对于CMS中最多人用的DEDE都要动用接口去采集我对火车头非常失望。我说的也是实话,火车头对于图片的采集处理方面真的是比较差的。
发表于 2010-2-6 22:30:16 | 显示全部楼层
同意楼主,在采集过程中确实遇到过这种情况,好像不光是图片,比如遇到要解密的附件,如果在标签里做了相关的代码替换的话,就会造成不能解密附件地址或下载,遇到这种情况只能放弃替换操作,希望官方重视。
发表于 2010-2-7 11:00:57 | 显示全部楼层
winform软件不像是脚本,开发周期会相应的较长,
而且功能全是固化在程序中的,
这也是为什么火车加了插件支持,
程序是死的,但配合脚本就成了活的,
本人觉得程序没有万能的,每个人的要求也是不同的
如果把所有人的要求满足了,从使用者角度上可能是一个好程序
但从开发者角度来说可能就相反了

像以上两位遇到的情况,如果不是很特殊,其实用一段php(或写个dll)基本就可以解决

如果有说的不对之处欢迎车友指正
 楼主| 发表于 2010-2-7 17:40:46 | 显示全部楼层
winform软件不像是脚本,开发周期会相应的较长,
而且功能全是固化在程序中的,
这也是为什么火车加了插件 ...
aven 发表于 2010-2-7 11:00



    程序设计出来是给谁用的?设计者用?还是终端客户用?如果是设计者用也没必要放出程序。如果是用户用,用户使用感受应该放在第一位。
发表于 2010-2-7 17:50:21 | 显示全部楼层
明明用脚本可以解决

我想官方不会去麻烦的修改程序
 楼主| 发表于 2010-2-7 19:33:40 | 显示全部楼层
明明用脚本可以解决

我想官方不会去麻烦的修改程序
aven 发表于 2010-2-7 17:50



    如果是这样火车头也没有新版本出了吧?用脚本都可以解决了!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-4-21 05:26

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表