火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 15260|回复: 8

火车头终极伪原创<三>

[复制链接]
发表于 2011-3-28 15:27:47 | 显示全部楼层 |阅读模式
很久很久很久很久没有使用火车头了,今天需要用火车头采集文章做一个数据库,于是顺便到论坛逛逛。发现N多个站内信询问N久前发布的 火车头终极伪原创<一>  火车头终极伪原创<二> 等问题,由于时间久远,就不再讨论了。

今天再发一个有效的伪原创方案,随机提取文章中的一句话作为标题  配合百度关键词前缀,一年来测试效果还是很不错的。 其他的很多工具都有了此功能 比如虫虫啥的

配合以前写的一个 “泛采集”插件   就是不用写采集规则  直接把内容和标题提取出来,这样基本的垃圾站群工具就OK了。

其实核心就是一句提不上把的正则

[[:punct:]]([^[:punct:]]{5,30})[[:punct:]]

如果提取不到合适的标题就用原始标题

附件传不了,直接贴代码吧。

PS:这个是用php写的插件,请确保你的火车头版本可以使用插件。
如果免费版,可以把这个改造成dedecms的插件,直接作为dede的系统功能。交流群:128864568


<?php
/*
        随机提取一句话作为标题
        By:SeoLei
        QQ: 42527832
        版权无所谓 任意修改传播
*/
$temp=$LabelArray['内容'];
$temp=preg_replace("%<[^>]+>%",',',$temp);                        //防止网址中字母被匹配

$temp=make_semiangle($temp);                                                //半角转化

if(preg_match_all("%[[:punct:]]([^[:punct:]]{5,30})[[:punct:]]%u",$temp,$arr)){
        $i=rand(0,count($arr[0])-1);
        $LabelArray['标题']=$arr[1][$i];
}


// 全角半角转
function make_semiangle($str)  
{  
    $arr = array('0' => '0', '1' => '1', '2' => '2', '3' => '3', '4' => '4',  
                 '5' => '5', '6' => '6', '7' => '7', '8' => '8', '9' => '9',  
                 'A' => 'A', 'B' => 'B', 'C' => 'C', 'D' => 'D', 'E' => 'E',  
                 'F' => 'F', 'G' => 'G', 'H' => 'H', 'I' => 'I', 'J' => 'J',  
                 'K' => 'K', 'L' => 'L', 'M' => 'M', 'N' => 'N', 'O' => 'O',  
                 'P' => 'P', 'Q' => 'Q', 'R' => 'R', 'S' => 'S', 'T' => 'T',  
                 'U' => 'U', 'V' => 'V', 'W' => 'W', 'X' => 'X', 'Y' => 'Y',  
                 'Z' => 'Z', 'a' => 'a', 'b' => 'b', 'c' => 'c', 'd' => 'd',  
                 'e' => 'e', 'f' => 'f', 'g' => 'g', 'h' => 'h', 'i' => 'i',  
                 'j' => 'j', 'k' => 'k', 'l' => 'l', 'm' => 'm', 'n' => 'n',  
                 'o' => 'o', 'p' => 'p', 'q' => 'q', 'r' => 'r', 's' => 's',  
                 't' => 't', 'u' => 'u', 'v' => 'v', 'w' => 'w', 'x' => 'x',  
                 'y' => 'y', 'z' => 'z',  
                 '(' => '(', ')' => ')', '〔' => '[', '〕' => ']', '【' => '[',  
                 '】' => ']', '〖' => '[', '〗' => ']', '“' => '[', '”' => ']',  
                 '‘' => '[', '’' => ']', '{' => '{', '}' => '}', '《' => '<',  
                 '》' => '>',  
                 '%' => '%', '+' => '+', '—' => '-', '-' => '-', '~' => '-',  
                 ':' => ':', '。' => '.', '、' => ',', ',' => '.', '、' => '.',  
                 ';' => ',', '?' => '?', '!' => '!', '…' => '-', '‖' => '|',  
                 '”' => '"', '’' => '`', '‘' => '`', '|' => '|', '〃' => '"',  
                 ' ' => ' ','$'=>'$','@'=>'@','#'=>'#','^'=>'^','&'=>'&','*'=>'*',
                 '"'=>'"');
  
    return strtr($str, $arr);  
}
echo serialize($LabelArray);
?>
发表于 2011-3-28 15:38:12 | 显示全部楼层
谢谢分享。支持一下。
发表于 2011-3-28 16:03:47 | 显示全部楼层
学习学习了了
发表于 2011-3-28 17:09:04 | 显示全部楼层
火车人发来贺电.....
发表于 2011-3-29 13:20:12 | 显示全部楼层
不错的插件您的帖子长度不符合要求
发表于 2011-3-29 21:37:51 | 显示全部楼层
比较利害,可惜用不了~
发表于 2011-6-8 16:26:55 | 显示全部楼层
厉害,无语了。。
发表于 2016-6-27 23:59:25 | 显示全部楼层
顶起!谢谢分享
发表于 2016-7-7 11:47:50 | 显示全部楼层
楼主,可以告诉你一下怎么操作添加吗??
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 00:23

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表