强烈建议加强软件地址采集功能.
希望能够自动识别软件地址,支持采集多个下载地址比如
<a href="http://www.sdfsf.com/laofuzi.exe">下载地址</a> 这样一个地址,在不写任何过滤规则情况下,能够识别成 http://www.sdfsf.com/laofuzi.exe 不要以为我在开玩笑,目前许多CMS自带的采集都支持此功能了.难道象火车头这样专业的采集器不应该支持么?比如DEDE默认采集,用软件采集模型,加入自定义接口,就可以识别我所说的那样的地址了.其实就是在程序中加入简单的函数就能实现..这样的好处多的是.比如能够采集多个下载地址(我测试理论上是无限个).能够采集电驴那样的下载地址.
DEDE软件采集的接口参考.是PHP的,非常简单, 不懂程序的基本上都能看懂。我想对老大应该会有点帮助的。
function CombinAddress($address)
{
$curl="";
preg_match_all('/href="(.+?)"/is',$address,$addarray); //获取下载地址
for($i=1;$i<=count($addarray);$i++)
{
$curl.="{dede:link text='下载地址$i'}".$addarray[$i-1]."{/dede:link}\r\n"; //自动转换成DEDE所需要的下载地址格式
}
return $curl;
} 看不明白..
火车本来就是自动识别软件地址,支持采集多个下载地址呀 怎么识别啊,默认不支持的. 正则不是一般人能搞懂的.希望能出教程. 就是,怎么就没有软件采集的教程呢???
我也一直在找啊
我也一直在找啊的 能象迅雷一样识别下载地址就好了 是呀,关于火车头采集软件我都郁闷了好几天啦!~ lz的名字太强大了························ 8# fly86413确实够强大 都不知道火车头什么时候能变成飞机头 事故小一些 <script>document.write(getInfoArticleURL(40,1261772,"房东出租房屋",idWriter,key,null,29));</script>这样的地址能否采集?关键在:1261772,其它的地地址是可以点击连接进去得到,是相对固定的,采集网址能否也能象内容一样用“*”来代替?
页:
[1]
2