火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6655|回复: 10

强烈建议加强软件地址采集功能.

[复制链接]
发表于 2007-11-9 12:15:33 | 显示全部楼层 |阅读模式
希望能够自动识别软件地址,支持采集多个下载地址

比如
<a href="http://www.sdfsf.com/laofuzi.exe">下载地址</a> 这样一个地址,在不写任何过滤规则情况下,能够识别成 http://www.sdfsf.com/laofuzi.exe 不要以为我在开玩笑,目前许多CMS自带的采集都支持此功能了.难道象火车头这样专业的采集器不应该支持么?比如DEDE默认采集,用软件采集模型,加入自定义接口,就可以识别我所说的那样的地址了.其实就是在程序中加入简单的函数就能实现..这样的好处多的是.比如能够采集多个下载地址(我测试理论上是无限个).能够采集电驴那样的下载地址.

DEDE软件采集的接口参考.是PHP的,非常简单, 不懂程序的基本上都能看懂。我想对老大应该会有点帮助的。

function CombinAddress($address)
{
$curl="";
preg_match_all('/href="(.+?)"/is',$address,$addarray);    //获取下载地址
for($i=1;$i<=count($addarray[1]);$i++)
{  
$curl.="{dede:link text='下载地址$i'}".$addarray[1][$i-1]."{/dede:link}\r\n";      //自动转换成DEDE所需要的下载地址格式
}
return $curl;
}
发表于 2007-11-9 13:02:42 | 显示全部楼层
看不明白..
火车本来就是自动识别软件地址,支持采集多个下载地址呀
 楼主| 发表于 2007-11-10 14:15:32 | 显示全部楼层
怎么识别啊,默认不支持的. 正则不是一般人能搞懂的.希望能出教程.
发表于 2007-12-7 11:01:34 | 显示全部楼层
就是,怎么就没有软件采集的教程呢???
发表于 2008-11-22 22:46:38 | 显示全部楼层

我也一直在找啊

我也一直在找啊的
发表于 2008-12-19 11:48:19 | 显示全部楼层
能象迅雷一样识别下载地址就好了
发表于 2009-2-10 22:00:41 | 显示全部楼层
是呀,关于火车头采集软件我都郁闷了好几天啦!~
发表于 2009-2-13 16:57:55 | 显示全部楼层
lz的名字太强大了························
发表于 2009-3-20 14:16:26 | 显示全部楼层
8# fly86413


确实够强大 都不知道火车头什么时候能变成飞机头 事故小一些
发表于 2009-5-10 11:14:04 | 显示全部楼层
<script>document.write(getInfoArticleURL(40,1261772,"房东出租房屋",idWriter,key,null,29));</script>这样的地址能否采集?关键在:1261772,其它的地地址是可以点击连接进去得到,是相对固定的,采集网址能否也能象内容一样用“*”来代替?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 14:04

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表