火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 12854|回复: 26

2009sp2版新增功能预览

 关闭 [复制链接]
发表于 2009-4-25 12:13:30 | 显示全部楼层 |阅读模式
1、php接口支持各个标签间相互调用啦

详细介绍请移步:http://wiki.locoy.com/doc-view-46

接口样例代码:
  1. <?php
  2. //############################################################################################################################################################
  3. // 火车采集器外部编程接口处理标签内容示范文件 ##
  4. /* ##
  5. * ★★★ [V2009SP2版开始对原接口规则进行了修改]★★★ ##
  6. * 不再对每个标签及标签内容调用PHP分别处理一次 ##
  7. * 而是直接对整个标签集合数组统一处理 ##
  8. * 该文件内自动系统的三个参数$LabelArray $LabelCookie $LabelUrl ##
  9. * 对任意采集的标签都适用,请对标签内容处理后直接将该数组serialize($LabelArray)输出, ##
  10. * 采集器内部即可接收到该标签的内容,对比以前的接口规则,新规则可以实现标签之间的数据调用和处理 ##
  11. * ##
  12. * 参数说明: ##
  13. * $LabelArray - 标签名及标签内容集合 结构如:Array('栏目id' => 2,'出处'=> 'www.locoy.com','作者'=>'火车采集器','内容'=>'<center><b>暴笑短信') ##
  14. * $LabelCookie - 对应采集中用到的Cookie值 ##
  15. * $LabelUrl - 当前采集的页面的Url地址 ##
  16. * @Author Locoy ##
  17. * @CreateTime 2008-05-28 00:12:23 ##
  18. * @ModifyTime 2009-04-24 16:14:00 ##
  19. * @Copyright Copyright (c) 2005-2009 http://www.locoy.com ##
  20. * @Version LocoySpider 2009SP2 or later ##
  21. * @Licence Support On LocoySpider Standard and Enterprise Edition ##
  22. */ ##
  23. //############以上语句建议不更改##############################################################################################################################
  24. //############以下为用户操作区域 该区域只限对数组值进行操作,不得有打印输出产生##############################################################################



  25. $LabelArray['内容'] = $LabelArray['标题'].$LabelArray['内容']; //★★★★★★注意这句。V2009SP2版后可实现多标签之间的相互调用★★★★★★
  26. $LabelArray['内容'] = str_replace('老鼠','▲▲▲死老鼠▲▲▲',$LabelArray['内容']); //简单替换一下

  27. $LabelArray['标题'] = '【给标题标签加个前缀】'.$LabelArray['标题'];

  28. $LabelArray['时间'] =date('Y-m-d H:i:s',time()); //不用标签内容,直接获取time()函数得到的当前时间,用Y-m-d H:i:s格式输出,如2008-05-28 00:12:23

  29. $authorarray = array('火车头','孤魂','飞越无限','Vus520','小文','麦兜','netdream','天毅','6sky','sengl');
  30. $rndnum = rand(0,9);
  31. $LabelArray['作者'] = '再刷新,后面变随机 '.$authorarray[$rndnum]; //输入一个随机作者




  32. //#############以上为用户操作区域#############################################################################################################################
  33. //#############以下语句必须保留,建议不更改###################################################################################################################
  34. //ob_clean();
  35. echo serialize($LabelArray);
  36. ?>
复制代码
2、可以对过滤掉重复的标签内容了!(不只是简单的网址重复过滤)


3、对采集过程中出现错误的记录有错误处理机制了。以前网络出现错误时一样会标记为采集成功。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-4-25 12:19:56 | 显示全部楼层
本帖最后由 ghostscat 于 2009-4-25 12:22 编辑

sp2版本什么时候更新?

接口支持数组,呵
发表于 2009-4-25 12:48:38 | 显示全部楼层
本帖最后由 专业收费采集 于 2009-4-25 13:01 编辑

强烈支持~老大 速度发布SP2吧
发表于 2009-4-25 13:01:19 | 显示全部楼层
很好。
发表于 2009-4-25 13:43:44 | 显示全部楼层
太好了,现在编辑接口就更方便了。
发表于 2009-4-25 14:20:42 | 显示全部楼层
标签套用这个功能,确实是非常牛鼻的功能。
PHP程序员可以使用这个功能,将火车采集器采集的数据,进行实时的处理,然后入库。
甚至实现网站前台的同步更新也不在话下。

重复内容排除这个功能,虽然会增加数据除重的查询时间,但是在某些特定的用户眼里,却是非常重要,非常人性化的功能。


PS by 火车头:尘缘对第二点的理解有误:虽然会增加数据除重的查询时间,新版并不是通过选择查询排重的,而是直接修改表结构,增加不得重复唯一索引,重复的无法插入,所以执行的时候并没有增加SQL选择执行语句
发表于 2009-4-25 16:02:18 | 显示全部楼层
牛BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
发表于 2009-4-25 18:26:02 | 显示全部楼层
看来的化银子升级了!!
发表于 2009-4-25 19:04:14 | 显示全部楼层
功能越来越牛了,可俺越来越不会用了
发表于 2009-4-25 19:39:32 | 显示全部楼层
希望早见天日
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-15 15:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表