|
希望能够自动识别软件地址,支持采集多个下载地址
比如
<a href="http://www.sdfsf.com/laofuzi.exe">下载地址</a> 这样一个地址,在不写任何过滤规则情况下,能够识别成 http://www.sdfsf.com/laofuzi.exe 不要以为我在开玩笑,目前许多CMS自带的采集都支持此功能了.难道象火车头这样专业的采集器不应该支持么?比如DEDE默认采集,用软件采集模型,加入自定义接口,就可以识别我所说的那样的地址了.其实就是在程序中加入简单的函数就能实现..这样的好处多的是.比如能够采集多个下载地址(我测试理论上是无限个).能够采集电驴那样的下载地址.
DEDE软件采集的接口参考.是PHP的,非常简单, 不懂程序的基本上都能看懂。我想对老大应该会有点帮助的。
function CombinAddress($address)
{
$curl="";
preg_match_all('/href="(.+?)"/is',$address,$addarray); //获取下载地址
for($i=1;$i<=count($addarray[1]);$i++)
{
$curl.="{dede:link text='下载地址$i'}".$addarray[1][$i-1]."{/dede:link}\r\n"; //自动转换成DEDE所需要的下载地址格式
}
return $curl;
} |
|