火车头最难的两大问题，寻求高手解决！！

lingchen8321 发表于 2009-1-5 18:28:35

火车头最难的两大问题，寻求高手解决！！

1、如何实现软件采集过程中的本地化。就是不采集软件连接地址，而是把别人的网站软件（通常为exe、rar格式），采集到本地（自己的服务器上）。现在好像只能盗链

2、如何实现软件采集过程中，自动识别下载地址和新页面下载。详细一点：现在大多数的网站都不是给出的真实下载地址（http://ftp.ruiwen.com/mf_down.php?soft=ruiwen-200705023404-714917-552162.ppt&title=高考语文备考讲座：现代文阅读），而是这种（http://www.teacher360.cn/soft/download.asp?softid=1591&downid=2&id=1608）。如何实现只要本机能下载的，就能采集？？？
其次，就是现在的软件，课件等资源类网站大多数采用新云的下载模板，要点击多个页面才能找到下载地址的，又如何实现下载。

抛出这两大难题，望高手能解决！

xiongyujie37 发表于 2009-1-5 18:40:09

{:3_147:}我是高手？

1、个人版以上用户早就实现了。。。
2、多页采集啊。。。

xiongyujie37 发表于 2009-1-5 18:40:31

貌似米有难度。。。

sushy 发表于 2009-1-5 19:37:19

火车是按源码规则来分析的，并且内部没有自带的判断程式。所以就你这个问题，让我火车自己判断是当前链接下载还是在新页面下载比较困难。

不过一个网站有两种下载规则，貌似我还没见过。如果你用一个规则，用于多个任务，可能需要自己先判断，在让火车干活。

lovebaidu 发表于 2009-1-5 20:45:59

ksk ksk .呵呵。商业版已经解决了。

页: [1]

火车采集器软件交流官方论坛's Archiver

火车头最难的两大问题，寻求高手解决！！