|
我想对采集到的标题内容做一下处理,打个简单比方给标题前都加上个“【原创】”,
插件设置应该选择“采内容”还是选“保存时”??
插件代码在插件管理器中测试正常,代码如下,- *对任意采集的标签都适用请对标签内容处理后直接将该数组serialize($LabelArray)输出,
- *采集器内部即可接收到该标签的内容,对比以前的接口规则,新规则可以实现标签之间的数据调用和处理
- *参数说明:
- *$LabelArray - 标签名及标签内容集合 结构如:Array('栏目id' => 2,'出处'=> 'www.xxx.com','作者'=>'火车采集器','内容'=>'<center><b>暴笑短信') ##
- *$LabelCookie - 对应采集中用到的Cookie值
- *$LabelUrl - 当前采集的页面的Url地址
- * 特别注意:如果是处理列表页,默认页,多页时会有以下两个标签
- $LabelArray['Html'] 网页的源代码,没有经过采集器处理的,直接下载后的数据.修改这里的数据,请将新值赋予$LabelArray['Html']
- $LabelArray['PageType'] 值可能为 List, Pages, Content 分别代表处理列表页,多页,默认页
- *以上语句建议不更改,以下为用户操作区域 该区域只限对数组值进行操作,不得有打印输出产生,不得直接增加或删除相应标签名
- */
- if($LabelArray['Html'])
- {
- $LabelArray['Html']='当前页面的网址为:'.$LabelUrl.'页面类型为:'.$LabelArray['PageType']."\r\nCookies数据为:$LabelCookie\r\n接收到的数据是:".$LabelArray['Html'];
- }
- else
- {
- $LabelArray['内容'] = $LabelArray['标题'].$LabelArray['内容'];
- $LabelArray['内容'] = str_replace('原字符串','要替换的新的字符串',$LabelArray['内容']); //简单替换一下
- $LabelArray['标题'] = '【原创】'.$LabelArray['标题'];
- $LabelArray['时间'] =date('Y-m-d H:i:s',time()); //不用标签内容,直接获取time()函数得到的当前时间,用Y-m-d H:i:s格式输出,如2008-05-28 00:12:23
- $authorarray = array('作者1','作者2','作者3','作者4','作者5','作者6','作者7','作者8','作者9','作者10');
- $rndnum = rand(0,9);
- $LabelArray['作者'] = '再刷新,后面变随机 '.$authorarray[$rndnum]; //输入一个随机作者
- }
- //#############以上为用户操作区域#############################################################################################################################
- //#############以下语句必须保留,建议不更改###################################################################################################################
- //ob_clean();
- echo serialize($LabelArray);
- ?>
复制代码 |
|