rq204 发表于 2009-4-25 12:13:30

2009sp2版新增功能预览

1、php接口支持各个标签间相互调用啦

详细介绍请移步:http://wiki.locoy.com/doc-view-46

接口样例代码:<?php
//############################################################################################################################################################
// 火车采集器外部编程接口处理标签内容示范文件 ##
/* ##
* ★★★ ★★★ ##
* 不再对每个标签及标签内容调用PHP分别处理一次 ##
* 而是直接对整个标签集合数组统一处理 ##
* 该文件内自动系统的三个参数$LabelArray $LabelCookie $LabelUrl ##
* 对任意采集的标签都适用,请对标签内容处理后直接将该数组serialize($LabelArray)输出, ##
* 采集器内部即可接收到该标签的内容,对比以前的接口规则,新规则可以实现标签之间的数据调用和处理 ##
* ##
* 参数说明: ##
* $LabelArray - 标签名及标签内容集合 结构如:Array('栏目id' => 2,'出处'=> 'www.locoy.com','作者'=>'火车采集器','内容'=>'<center><b>暴笑短信') ##
* $LabelCookie - 对应采集中用到的Cookie值 ##
* $LabelUrl - 当前采集的页面的Url地址 ##
* @Author Locoy ##
* @CreateTime 2008-05-28 00:12:23 ##
* @ModifyTime 2009-04-24 16:14:00 ##
* @Copyright Copyright (c) 2005-2009 http://www.locoy.com ##
* @Version LocoySpider 2009SP2 or later ##
* @Licence Support On LocoySpider Standard and Enterprise Edition ##
*/ ##
//############以上语句建议不更改##############################################################################################################################
//############以下为用户操作区域 该区域只限对数组值进行操作,不得有打印输出产生##############################################################################



$LabelArray['内容'] = $LabelArray['标题'].$LabelArray['内容']; //★★★★★★注意这句。V2009SP2版后可实现多标签之间的相互调用★★★★★★
$LabelArray['内容'] = str_replace('老鼠','▲▲▲死老鼠▲▲▲',$LabelArray['内容']); //简单替换一下

$LabelArray['标题'] = '【给标题标签加个前缀】'.$LabelArray['标题'];

$LabelArray['时间'] =date('Y-m-d H:i:s',time()); //不用标签内容,直接获取time()函数得到的当前时间,用Y-m-d H:i:s格式输出,如2008-05-28 00:12:23

$authorarray = array('火车头','孤魂','飞越无限','Vus520','小文','麦兜','netdream','天毅','6sky','sengl');
$rndnum = rand(0,9);
$LabelArray['作者'] = '再刷新,后面变随机 '.$authorarray[$rndnum]; //输入一个随机作者




//#############以上为用户操作区域#############################################################################################################################
//#############以下语句必须保留,建议不更改###################################################################################################################
//ob_clean();
echo serialize($LabelArray);
?> 2、可以对过滤掉重复的标签内容了!(不只是简单的网址重复过滤)


3、对采集过程中出现错误的记录有错误处理机制了。以前网络出现错误时一样会标记为采集成功。

ghostscat 发表于 2009-4-25 12:19:56

本帖最后由 ghostscat 于 2009-4-25 12:22 编辑

sp2版本什么时候更新?

接口支持数组,呵

专业收费采集 发表于 2009-4-25 12:48:38

本帖最后由 专业收费采集 于 2009-4-25 13:01 编辑

强烈支持~老大 速度发布SP2吧

连通 发表于 2009-4-25 13:01:19

很好。ali6ls

chenfy 发表于 2009-4-25 13:43:44

太好了,现在编辑接口就更方便了。

vus520 发表于 2009-4-25 14:20:42

标签套用这个功能,确实是非常牛鼻的功能。
PHP程序员可以使用这个功能,将火车采集器采集的数据,进行实时的处理,然后入库。
甚至实现网站前台的同步更新也不在话下。

重复内容排除这个功能,虽然会增加数据除重的查询时间,但是在某些特定的用户眼里,却是非常重要,非常人性化的功能。


PS by 火车头:尘缘对第二点的理解有误:虽然会增加数据除重的查询时间,新版并不是通过选择查询排重的,而是直接修改表结构,增加不得重复唯一索引,重复的无法插入,所以执行的时候并没有增加SQL选择执行语句

xhat 发表于 2009-4-25 16:02:18

牛BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB

fenghai 发表于 2009-4-25 18:26:02

看来的化银子升级了!!

kiss2008 发表于 2009-4-25 19:04:14

功能越来越牛了,可俺越来越不会用了

算客2008 发表于 2009-4-25 19:39:32

希望早见天日
页: [1] 2 3
查看完整版本: 2009sp2版新增功能预览