火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 9850|回复: 16

利用PHP 插件如何判断是否是有图新闻及获取图片地址教程

[复制链接]
发表于 2010-6-18 11:10:52 | 显示全部楼层 |阅读模式
火车采集器里面其实有提取首张缩略图功能,但需要手工定义列表页地址格式,自定义链接地址的过程稍显复杂。

一个商业用户需要,这里利用PHP 插件简单实现一下,给其他会员也做个参考。

1、我们先新建两个标签,里面起始结束代码不用填任何东西,只用于插件后面对其进行赋值操作,保存数据。
这两个标签名分别是:首图,是否图片新闻

2、复制PHP-demo.php文件,修改为 PHP-zhangthree01.php

以下为获取第一张首图和判断是否图片新闻的主要代码,php文件见附件


  1. function bodyfirstimg($body) {
  2.                 $body = strtolower($body);
  3.                 if ( preg_match("/<img.*src=["](.*?)["].*?>/", $body, $regs))
  4.                 { //使用正则获取第一幅图像地址
  5.                         return $regs[1] ;
  6.                 }
  7.                 else
  8.                 {
  9.                         return '' ;
  10.                 }
  11. }


  12. if($LabelArray['Html'])
  13. {
  14.         $LabelArray['Html']='当前页面的网址为:'.$LabelUrl."\r\n页面类型为:".$LabelArray['PageType']."\r\nCookies数据为:$LabelCookie\r\n接收到的数据是:".$LabelArray['Html'];
  15. }
  16. else
  17. {

  18.         $LabelArray['首图'] = bodyfirstimg($LabelArray['内容']);
  19.         $LabelArray['是否图片新闻'] = $LabelArray['首图']==''?false:true;
  20. }

复制代码
该附件下载后解压为PHP-zhangthree01.php放到程序下Plugins目录

3、在插件配置那 考虑到采内容后还可能下载图片,所以选择在保存时选择此插件使用即可



4、以新浪新闻规则作为测试,效果如图

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-6-18 13:07:33 | 显示全部楼层
高端 没看懂

还是顶下。。。沙发

车头发滴,必输精品!!!
发表于 2010-6-20 01:22:24 | 显示全部楼层
太强了。。。。。。。。。。。。爱上火车
发表于 2010-6-20 13:50:38 | 显示全部楼层
本帖最后由 aven 于 2010-6-20 13:52 编辑

呵呵,
火车加php基本上很牛了
发表于 2010-6-20 14:08:18 | 显示全部楼层
我是新手,请多指教。
发表于 2010-6-20 23:00:42 | 显示全部楼层
标记一下 很有用 谢谢哈
发表于 2010-6-21 17:30:11 | 显示全部楼层
免费版用户没有自动FTP上传功能
那是否有手动上传功能?
发表于 2010-6-23 15:31:04 | 显示全部楼层
好东西啊!!支持一下!!!
发表于 2010-6-24 20:20:14 | 显示全部楼层
确实比较难懂,有更容易些的吗,可以发我电子邮箱吗:酷狗设计
发表于 2010-6-25 10:50:17 | 显示全部楼层
支持!!!支持!!!!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-22 11:45

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表