飞机头 发表于 2007-11-9 12:15:33

强烈建议加强软件地址采集功能.

希望能够自动识别软件地址,支持采集多个下载地址

比如
<a href="http://www.sdfsf.com/laofuzi.exe">下载地址</a> 这样一个地址,在不写任何过滤规则情况下,能够识别成 http://www.sdfsf.com/laofuzi.exe 不要以为我在开玩笑,目前许多CMS自带的采集都支持此功能了.难道象火车头这样专业的采集器不应该支持么?比如DEDE默认采集,用软件采集模型,加入自定义接口,就可以识别我所说的那样的地址了.其实就是在程序中加入简单的函数就能实现..这样的好处多的是.比如能够采集多个下载地址(我测试理论上是无限个).能够采集电驴那样的下载地址.

DEDE软件采集的接口参考.是PHP的,非常简单, 不懂程序的基本上都能看懂。我想对老大应该会有点帮助的。

function CombinAddress($address)
{
$curl="";
preg_match_all('/href="(.+?)"/is',$address,$addarray);    //获取下载地址
for($i=1;$i<=count($addarray);$i++)
{
$curl.="{dede:link text='下载地址$i'}".$addarray[$i-1]."{/dede:link}\r\n";      //自动转换成DEDE所需要的下载地址格式
}
return $curl;
}

rq204 发表于 2007-11-9 13:02:42

看不明白..
火车本来就是自动识别软件地址,支持采集多个下载地址呀

飞机头 发表于 2007-11-10 14:15:32

怎么识别啊,默认不支持的. 正则不是一般人能搞懂的.希望能出教程.

lanniao22 发表于 2007-12-7 11:01:34

就是,怎么就没有软件采集的教程呢???

a17004190 发表于 2008-11-22 22:46:38

我也一直在找啊

我也一直在找啊的

51908 发表于 2008-12-19 11:48:19

能象迅雷一样识别下载地址就好了

ahligaoming 发表于 2009-2-10 22:00:41

是呀,关于火车头采集软件我都郁闷了好几天啦!~

fly86413 发表于 2009-2-13 16:57:55

lz的名字太强大了························

xiaozong 发表于 2009-3-20 14:16:26

8# fly86413


确实够强大 都不知道火车头什么时候能变成飞机头 事故小一些

haoauhph 发表于 2009-5-10 11:14:04

<script>document.write(getInfoArticleURL(40,1261772,"房东出租房屋",idWriter,key,null,29));</script>这样的地址能否采集?关键在:1261772,其它的地地址是可以点击连接进去得到,是相对固定的,采集网址能否也能象内容一样用“*”来代替?
页: [1] 2
查看完整版本: 强烈建议加强软件地址采集功能.