|
火车采集器里面其实有提取首张缩略图功能,但需要手工定义列表页地址格式,自定义链接地址的过程稍显复杂。
一个商业用户需要,这里利用PHP 插件简单实现一下,给其他会员也做个参考。
1、我们先新建两个标签,里面起始结束代码不用填任何东西,只用于插件后面对其进行赋值操作,保存数据。
这两个标签名分别是:首图,是否图片新闻
2、复制PHP-demo.php文件,修改为 PHP-zhangthree01.php
以下为获取第一张首图和判断是否图片新闻的主要代码,php文件见附件
- function bodyfirstimg($body) {
- $body = strtolower($body);
- if ( preg_match("/<img.*src=["](.*?)["].*?>/", $body, $regs))
- { //使用正则获取第一幅图像地址
- return $regs[1] ;
- }
- else
- {
- return '' ;
- }
- }
- if($LabelArray['Html'])
- {
- $LabelArray['Html']='当前页面的网址为:'.$LabelUrl."\r\n页面类型为:".$LabelArray['PageType']."\r\nCookies数据为:$LabelCookie\r\n接收到的数据是:".$LabelArray['Html'];
- }
- else
- {
- $LabelArray['首图'] = bodyfirstimg($LabelArray['内容']);
- $LabelArray['是否图片新闻'] = $LabelArray['首图']==''?false:true;
- }
复制代码 该附件下载后解压为PHP-zhangthree01.php放到程序下Plugins目录
3、在插件配置那 考虑到采内容后还可能下载图片,所以选择在保存时选择此插件使用即可
4、以新浪新闻规则作为测试,效果如图
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|