火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 10367|回复: 14

火车头终极伪原创(三)

[复制链接]
发表于 2009-9-26 00:13:19 | 显示全部楼层 |阅读模式
[i=s] 本帖最后由 wmdly 于 2009-9-26 00:27 编辑 [/i]

一直都是用免费版本的火车采集器,当然如果有实力还是建议购买全功能的火车头。

说是终极伪原创(三),其实这个方法并不是专门用于伪原创的,甚至你可以用它实现任何你想实现的功能。

思路:用php通过file_get_contents函数抓取url源码,根据需要处理后调用echo输入 采集这个输入页面。由于抓取到本地,火车头再读取本地,所以整体效率并不降低多少。在这个过程中你可以格式化源码 可以重组标签,可以跨1页 2页 10页甚至更多页

核心代码: 采集网址的时候禁用自动获取 手动改成类似这样的  http://127.0.0.1/xxx.php?k=http://xxxxx
<?php
    $url = $_GET['k'];
    $file = file_get_contents($url);
   //此处可以实现任何你想要的功能 比如 近义词替换 分词  过滤少于多少字或者多余多少字的文章 删除含有某些敏感词的文章 附件里的演示是将繁体转换成简体
    echo $file;
?>

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

1

查看全部评分

发表于 2009-9-26 00:15:50 | 显示全部楼层
占位置 慢慢看  ...
发表于 2009-9-26 00:19:11 | 显示全部楼层
懂PHP的话, 可以实现很多功能.
 楼主| 发表于 2009-9-26 14:58:25 | 显示全部楼层
还有很重要的一个功能已经加上了  就是可以调用googleAPI 将中文翻译英文,做英文站是个不错的选择。有人直接翻译后做英文站做到了1万刀每月  看到那些每天嚷嚷说直接翻译google不收录的朋友,我想问一句,你去做了么?
发表于 2009-9-27 00:57:38 | 显示全部楼层
1W?

不要人云亦云啦
发表于 2009-9-27 08:31:17 | 显示全部楼层
4楼的吹牛不上税. google 翻译api早几年就在研究,技术上是不可能实现大批量采集的. 用入万刀的,靠英文站的我没见过几个,靠做鬼的大有人在.
 楼主| 发表于 2009-9-27 14:36:09 | 显示全部楼层
本帖最后由 wmdly 于 2009-9-27 14:38 编辑

回复5楼 6楼

大批量采集从技术上无法实现?为什么无法实现?因为采集250次会要求输入验证码?  我采集了3万数据 照样采集
就算要求输入验证码那又怎样。 解决办法很简单,数据库里直接放采集原文,有人访问的时候由用户触发翻译API 这样约等于每个访客都是你的翻译工,大批量的问题不就解决了么?

你没见过几个超过一万到的,就不允许别人见过的?说实在的,我也没见到,我只是根据我的结果推测的。下面图片也不全是英文站的收入。



顺便说一句,不要以为自己硬不起来都说别人是软的。而且我的翻译也不是直接汉语转英语的,直接翻译后的文章不和老外的口味。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-9-27 17:39:21 | 显示全部楼层
要顶下楼主,上次楼主教的很细心,因自己太菜,后来自己换个方式做到了
发表于 2009-9-27 22:47:33 | 显示全部楼层
还有很重要的一个功能已经加上了  就是可以调用googleAPI 将中文翻译英文,做英文站是个不错的选择。有人直接翻译后做英文站做到了1万刀每月  看到那些每天嚷嚷说直接翻译google不收录的朋友,我想问一句,你去做了么 ...
wmdly 发表于 2009-9-26 14:58


楼主,你说加上了,在哪呀,为什么没找到呢?
发表于 2009-9-28 00:24:44 | 显示全部楼层
这个要顶!!!ali54ls
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-1 19:59

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表