火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3439|回复: 3

把内容按“。”分隔单独入库,为什么插件这么做不作用呢

[复制链接]
发表于 2015-7-2 18:06:36 | 显示全部楼层 |阅读模式
本帖最后由 haolijing 于 2015-7-2 18:12 编辑

<?php
error_reporting(E_ERROR | E_WARNING | E_PARSE);
/*
*外部编程接口处理标签内容示范文件                                                                                                                                                                                                                        
*该文件内自动系统的三个参数$LabelArray $LabelCookie,$LabelUrl
*对任意采集的标签都适用请对标签内容处理后直接将该数组serialize($LabelArray)输出,
*采集器内部即可接收到该标签的内容,对比以前的接口规则,新规则可以实现标签之间的数据调用和处理                                                                                                               
*参数说明:                                                                                                                                                                                                                                                                                       
  *$LabelArray    -  标签名及标签内容集合 结构如:Array('栏目id' => 2,'出处'=>  '新浪微博','内容'=>'<center><b>暴笑短信')  ##
  *$LabelCookie   -  对应采集中用到的Cookie值                                                        
  *$LabelUrl      -  当前采集的页面的Url地址
  * 特别注意:如果是处理列表页,默认页,多页时会有以下两个标签
    $LabelArray['Html']       网页的源代码,没有经过采集器处理的,直接下载后的数据.修改这里的数据,请将新值赋予$LabelArray['Html']
    $LabelArray['PageType']   值可能为 List, Content ,Pages, Save 分别代表处理列表页,默认页,多页,保存时                                                                                                                                                
*以上语句建议不更改,以下为用户操作区域  该区域只限对数组值进行操作,不得有打印输出产生,不得直接增加或删除相应标签名
*/
if($LabelArray['内容'])
{
$neirong = $LabelArray['内容'];//按句号分离字符串
$neirong2 = explode('。',$neirong);

for($index=0;$index<count($neirong2);$index++)
{
$LabelArray['内容']=$neirong2[$index];
}
}
//ob_clean();
echo serialize($LabelArray);
?>

测试结果
处理前的内容:这里。测试。是没有。传入
插件处理后的内容,只有一个词:传入

为什么前面的“这里”。“测试”。“是没有”都没有循环出来呢


 楼主| 发表于 2015-7-2 18:08:06 | 显示全部楼层
测试结果
处理前的内容:这里。测试。是没有。传入
插件处理后的内容,只有一个词:传入

为什么前面的“这里”。“测试”。“是没有”都没有循环出来呢
发表于 2015-7-3 09:13:14 | 显示全部楼层
if($LabelArray['内容'])
{
$neirong = $LabelArray['内容'];//按句号分离字符串
$neirong2 = explode('。',$neirong);

for($index=0;$index<count($neirong2);$index++)
{
$LabelArray['内容2'].=$neirong2[$index];
}
$LabelArray['内容']=$LabelArray['内容2'];
}
//ob_clean();
echo serialize($LabelArray);
?>
 楼主| 发表于 2015-7-3 10:12:21 | 显示全部楼层
谢谢kuhabe
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-18 03:29

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表