火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6647|回复: 10

用了标准版1个月了,说说感受与建议

[复制链接]
发表于 2009-11-2 11:53:35 | 显示全部楼层 |阅读模式
用了标准版1个月了,遇到了不少问题,也解决了不少问题,期间谢谢各位管理员的大力帮忙与热心解答。无限,孤魂,小文等都是很好很热心的管理员。

在功能方面发现一个硬伤:
    1.php插件支持的字节数太少了,一般采集博客都会出现溢出。有没有别的折中的办法?

还有2个关于更新采集的个人建议:
    1.在入库的时候可以操作源数据库。
    2.调度时,增加一个调度之前先清空采集地址或者清空采集内容。
    这两个细想一下就知道,是为了采集新发布的回复贴而做的。这样做的好处就是每次都会去采集同样的页面的同样的帖子,只要在数据库做好唯一性索引,旧的数据不会重复,新的数据也被采集到了。论坛最新回复的帖子都排在前面,我们只需要定时采集最前面那一页,不断重复采集,这样就可以达到更新采集的效果。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2009-11-2 12:01:33 | 显示全部楼层
1.php插件支持的字节数太少了,一般采集博客都会出现溢出。有没有别的折中的办法?

这个问题我反应好久了官方没有回答过.
发表于 2009-11-2 12:17:15 | 显示全部楼层
操作源数据库是指本地采集数据库么?
 楼主| 发表于 2009-11-2 13:35:04 | 显示全部楼层
对啊,源数据库就是我们采集的access数据库或者sqlit数据库,如果能在入库的时候或者web在线发布的时候对它进行操作,其实也可以实现真正意义上的更新采集。只要你目的数据库做好唯一性索引就好了
 楼主| 发表于 2009-11-2 13:41:20 | 显示全部楼层
1.php插件支持的字节数太少了,一般采集博客都会出现溢出。有没有别的折中的办法?

这个问题我反应好久了官方没有回答过.
鲁皖 发表于 2009-11-2 12:01


兄弟,php内容过长溢出估计不是我们两个首次发现的,是硬伤,我也没办法,好无奈。早知道买个人版算了,嘿嘿~
发表于 2009-11-2 15:07:19 | 显示全部楼层
1.php插件支持的字节数太少了,一般采集博客都会出现溢出。

这种情况可以用php辅助的形式、
不要用火车php插件的形式
发表于 2009-11-27 19:22:01 | 显示全部楼层
4# brian314

那个...买之前怎么没看见你的回复呢...

呵呵,当时买标准版就是奔着这个PHP插件功能去的.
发表于 2009-11-27 19:27:39 | 显示全部楼层
补充:购买火车头需要注意的事项.

1.对比火车几个版本的功能.了解免费版,个人版,标准版,企业版之间的功能差异.

2.比如你看上了火车的调用外部PHP插件功能.那就要考虑你是否具备PHP处理数据的能力了.另外,在购买前使用免费版的调用PHP插件测试下.

楼上说的溢出还没发现,但是发现不能使用include等函数调用PHP文件.这个很麻烦的,因为如果你需要的操作比较多,不可能全些一个文件里吧?

总之,根据你的需求去选择购买与否,还有就是测试,咨询清楚AD描述上的功能是否真正能满足你的需求.
发表于 2009-11-29 06:42:47 | 显示全部楼层
补充:购买火车头需要注意的事项.

1.对比火车几个版本的功能.了解免费版,个人版,标准版,企业版之间的功能差异.

2.比如你看上了火车的调用外部PHP插件功能.那就要考虑你是否具备PHP处理数据的能力了.另外,在购买 ...
chazinet 发表于 2009-11-27 19:27



你好,include 函数在php插件中是完全支持的,注意其工作目录是从火车采集器的程序主目录开始算起。或者建议您直接include(文件绝对地址)
发表于 2010-1-25 10:26:24 | 显示全部楼层
我也想弄个标准版,可是偶没钱啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-4 11:19

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表