|
1、php接口支持各个标签间相互调用啦
详细介绍请移步:http://wiki.locoy.com/doc-view-46
接口样例代码:- <?php
- //############################################################################################################################################################
- // 火车采集器外部编程接口处理标签内容示范文件 ##
- /* ##
- * ★★★ [V2009SP2版开始对原接口规则进行了修改]★★★ ##
- * 不再对每个标签及标签内容调用PHP分别处理一次 ##
- * 而是直接对整个标签集合数组统一处理 ##
- * 该文件内自动系统的三个参数$LabelArray $LabelCookie $LabelUrl ##
- * 对任意采集的标签都适用,请对标签内容处理后直接将该数组serialize($LabelArray)输出, ##
- * 采集器内部即可接收到该标签的内容,对比以前的接口规则,新规则可以实现标签之间的数据调用和处理 ##
- * ##
- * 参数说明: ##
- * $LabelArray - 标签名及标签内容集合 结构如:Array('栏目id' => 2,'出处'=> 'www.locoy.com','作者'=>'火车采集器','内容'=>'<center><b>暴笑短信') ##
- * $LabelCookie - 对应采集中用到的Cookie值 ##
- * $LabelUrl - 当前采集的页面的Url地址 ##
- * @Author Locoy ##
- * @CreateTime 2008-05-28 00:12:23 ##
- * @ModifyTime 2009-04-24 16:14:00 ##
- * @Copyright Copyright (c) 2005-2009 http://www.locoy.com ##
- * @Version LocoySpider 2009SP2 or later ##
- * @Licence Support On LocoySpider Standard and Enterprise Edition ##
- */ ##
- //############以上语句建议不更改##############################################################################################################################
- //############以下为用户操作区域 该区域只限对数组值进行操作,不得有打印输出产生##############################################################################
- $LabelArray['内容'] = $LabelArray['标题'].$LabelArray['内容']; //★★★★★★注意这句。V2009SP2版后可实现多标签之间的相互调用★★★★★★
- $LabelArray['内容'] = str_replace('老鼠','▲▲▲死老鼠▲▲▲',$LabelArray['内容']); //简单替换一下
- $LabelArray['标题'] = '【给标题标签加个前缀】'.$LabelArray['标题'];
- $LabelArray['时间'] =date('Y-m-d H:i:s',time()); //不用标签内容,直接获取time()函数得到的当前时间,用Y-m-d H:i:s格式输出,如2008-05-28 00:12:23
- $authorarray = array('火车头','孤魂','飞越无限','Vus520','小文','麦兜','netdream','天毅','6sky','sengl');
- $rndnum = rand(0,9);
- $LabelArray['作者'] = '再刷新,后面变随机 '.$authorarray[$rndnum]; //输入一个随机作者
- //#############以上为用户操作区域#############################################################################################################################
- //#############以下语句必须保留,建议不更改###################################################################################################################
- //ob_clean();
- echo serialize($LabelArray);
- ?>
复制代码 2、可以对过滤掉重复的标签内容了!(不只是简单的网址重复过滤)
3、对采集过程中出现错误的记录有错误处理机制了。以前网络出现错误时一样会标记为采集成功。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|