lingchen8321 发表于 2009-1-5 18:28:35

火车头最难的两大问题,寻求高手解决!!

火车头最难的两大问题,寻求高手解决!!

    1、如何实现软件采集过程中的本地化。就是不采集软件连接地址,而是把别人的网站软件(通常为exe、rar格式),采集到本地(自己的服务器上)。现在好像只能盗链

   2、如何实现软件采集过程中,自动识别下载地址和新页面下载。详细一点:现在大多数的网站都不是给出的真实下载地址(http://ftp.ruiwen.com/mf_down.php?soft=ruiwen-200705023404-714917-552162.ppt&title=高考语文备考讲座:现代文阅读),而是这种(http://www.teacher360.cn/soft/download.asp?softid=1591&downid=2&id=1608)。如何实现只要本机能下载的,就能采集???
其次,就是现在的软件,课件等资源类网站大多数采用新云的下载模板,要点击多个页面才能找到下载地址的,又如何实现下载。

    抛出这两大难题,望高手能解决!

xiongyujie37 发表于 2009-1-5 18:40:09

{:3_147:}我是高手?

1、个人版以上用户早就实现了。。。
2、多页采集啊。。。

xiongyujie37 发表于 2009-1-5 18:40:31

貌似米有难度。。。

sushy 发表于 2009-1-5 19:37:19

火车是按源码规则来分析的,并且内部没有自带的判断程式。所以就你这个问题,让我火车自己判断是当前链接下载还是在新页面下载比较困难。

不过一个网站有两种下载规则,貌似我还没见过。如果你用一个规则,用于多个任务,可能需要自己先判断,在让火车干活。

lovebaidu 发表于 2009-1-5 20:45:59

ksk ksk .呵呵。商业版已经解决了。
页: [1]
查看完整版本: 火车头最难的两大问题,寻求高手解决!!