2009sp2版新增功能预览
1、php接口支持各个标签间相互调用啦详细介绍请移步:http://wiki.locoy.com/doc-view-46
接口样例代码:<?php
//############################################################################################################################################################
// 火车采集器外部编程接口处理标签内容示范文件 ##
/* ##
* ★★★ ★★★ ##
* 不再对每个标签及标签内容调用PHP分别处理一次 ##
* 而是直接对整个标签集合数组统一处理 ##
* 该文件内自动系统的三个参数$LabelArray $LabelCookie $LabelUrl ##
* 对任意采集的标签都适用,请对标签内容处理后直接将该数组serialize($LabelArray)输出, ##
* 采集器内部即可接收到该标签的内容,对比以前的接口规则,新规则可以实现标签之间的数据调用和处理 ##
* ##
* 参数说明: ##
* $LabelArray - 标签名及标签内容集合 结构如:Array('栏目id' => 2,'出处'=> 'www.locoy.com','作者'=>'火车采集器','内容'=>'<center><b>暴笑短信') ##
* $LabelCookie - 对应采集中用到的Cookie值 ##
* $LabelUrl - 当前采集的页面的Url地址 ##
* @Author Locoy ##
* @CreateTime 2008-05-28 00:12:23 ##
* @ModifyTime 2009-04-24 16:14:00 ##
* @Copyright Copyright (c) 2005-2009 http://www.locoy.com ##
* @Version LocoySpider 2009SP2 or later ##
* @Licence Support On LocoySpider Standard and Enterprise Edition ##
*/ ##
//############以上语句建议不更改##############################################################################################################################
//############以下为用户操作区域 该区域只限对数组值进行操作,不得有打印输出产生##############################################################################
$LabelArray['内容'] = $LabelArray['标题'].$LabelArray['内容']; //★★★★★★注意这句。V2009SP2版后可实现多标签之间的相互调用★★★★★★
$LabelArray['内容'] = str_replace('老鼠','▲▲▲死老鼠▲▲▲',$LabelArray['内容']); //简单替换一下
$LabelArray['标题'] = '【给标题标签加个前缀】'.$LabelArray['标题'];
$LabelArray['时间'] =date('Y-m-d H:i:s',time()); //不用标签内容,直接获取time()函数得到的当前时间,用Y-m-d H:i:s格式输出,如2008-05-28 00:12:23
$authorarray = array('火车头','孤魂','飞越无限','Vus520','小文','麦兜','netdream','天毅','6sky','sengl');
$rndnum = rand(0,9);
$LabelArray['作者'] = '再刷新,后面变随机 '.$authorarray[$rndnum]; //输入一个随机作者
//#############以上为用户操作区域#############################################################################################################################
//#############以下语句必须保留,建议不更改###################################################################################################################
//ob_clean();
echo serialize($LabelArray);
?> 2、可以对过滤掉重复的标签内容了!(不只是简单的网址重复过滤)
3、对采集过程中出现错误的记录有错误处理机制了。以前网络出现错误时一样会标记为采集成功。
本帖最后由 ghostscat 于 2009-4-25 12:22 编辑
sp2版本什么时候更新?
接口支持数组,呵 本帖最后由 专业收费采集 于 2009-4-25 13:01 编辑
强烈支持~老大 速度发布SP2吧 很好。ali6ls 太好了,现在编辑接口就更方便了。 标签套用这个功能,确实是非常牛鼻的功能。
PHP程序员可以使用这个功能,将火车采集器采集的数据,进行实时的处理,然后入库。
甚至实现网站前台的同步更新也不在话下。
重复内容排除这个功能,虽然会增加数据除重的查询时间,但是在某些特定的用户眼里,却是非常重要,非常人性化的功能。
PS by 火车头:尘缘对第二点的理解有误:虽然会增加数据除重的查询时间,新版并不是通过选择查询排重的,而是直接修改表结构,增加不得重复唯一索引,重复的无法插入,所以执行的时候并没有增加SQL选择执行语句 牛BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB 看来的化银子升级了!! 功能越来越牛了,可俺越来越不会用了 希望早见天日