火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5812|回复: 7

关于优化附件下载的建议

[复制链接]
发表于 2010-5-1 14:16:32 | 显示全部楼层 |阅读模式
本帖最后由 soarb 于 2010-5-1 14:33 编辑

这是2010版

第一个,关于附件真实地址探测的问题。虽然火车头设置了可以http头自动跳转,就我在2010个人版中的观察和测试,对于不支持断点续传的文件,都不显示真实地址。(可以下载,但是下载表中显示的真实地址不是得到文件的最终地址)。

第二个,下载附件在全局中设置在迅雷中下载后,在数据表中则没有下载清单,好像是直接保存在内存中,然后写入html中。希望先保存在数据表中,然后根据需要,按用户自定义的格式生成html ,list的下载清单。(方便不同系统,不同下载工具的需要)

第三个,就是异步采集还没不能做到异步,是采集网页就有下载。
发表于 2010-5-3 07:44:00 | 显示全部楼层
本帖最后由 sushy 于 2010-5-2 23:45 编辑

后两个我不是很熟悉,我解释下第一个为什么得不到真实地址。

这要从服务器上的程序原理说起。比如一个文件的绝对地址是 www.aaa.com/test.rar ,相对地址是 www.aaa.com/download.php?id=999 。如果网站使用相对地址,则download.php 这个程序启动,将test读入内存,并发送给客户机。它读入内存的过程是在服务器端运行的,与表现形式无关。据我所知,discuz phpwind都是使用这类方法。

另外一种是 www.aaa.com/download.php?id=999通过跳转的方式跳转到 www.aaa.com/test.rar ,也就是说,test.rar 直接发送给客户机。

这两种的原理不同,第一种方式是读取真实文件并发送,不支持断点续传,得不到真实地址。第二种方式跳转到文件,支持断点续传(当然也要看服务器有没有其他限制),可以得到真是地址。
发表于 2010-5-3 07:54:22 | 显示全部楼层
这就相当于卖东西,
一种是从仓库拉过来再给你,你无法知道仓库的地址。
一种是收了你的钱后,告诉你仓库的地址,让你去拉。
 楼主| 发表于 2010-5-3 09:16:45 | 显示全部楼层
后两个我不是很熟悉,我解释下第一个为什么得不到真实地址。

这要从服务器上的程序原理说起。比如一个文 ...
sushy 发表于 2010-5-3 07:44



    对。我说的第一个问题是在第一种情况下产生的。不过是多重跳转。

就sushy所说,如得到的地址是 http://www.aaa.com/download.php?id=999,服务器会判断请求的合法性,如真, 则 302跳转到http://www.aaa.com/download.php?id=999&key=abc 读写出文件给用户。 而这时火车的下载清单得到的地址是http://www.aaa.com/download.php?id=999 而不是包含密钥的 http://www.aaa.com/download.php?id=999&key=abc.
假如用户用迅雷就无法从http://www.aaa.com/download.php?id=999  下载文件了。
发表于 2010-5-5 04:34:27 | 显示全部楼层
en ```太难了``
发表于 2010-5-13 08:55:02 | 显示全部楼层
好像迅雷支持302跳转的吧,而且火车自带的下载工具貌似也支持302跳转的。
发表于 2010-7-30 20:34:06 | 显示全部楼层
太晕了,没怎么看懂,只能再努力看看了
发表于 2016-2-8 23:07:19 | 显示全部楼层
支持火车。。。。历史帖子回顾中。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-9-6 16:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表