火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5850|回复: 11

希望有个既支持倒序又支持随机发布功能

[复制链接]
发表于 2008-11-21 11:34:53 | 显示全部楼层 |阅读模式
简洁一点来讲

比如我每天都会跟踪网易新闻

每天采集到的帖数不一样,比如 今天采集到200篇

可是我只想发布50篇,而这50篇只能从今天采集到的200篇中产生


目前火车头还做不到这点,要么就倒序发布。要么一随机,就从整个采集内容中随机了。。。
发表于 2008-11-21 15:18:44 | 显示全部楼层
单独复制一个同样的规则出来,只采集当前新闻,使用随机发布。
 楼主| 发表于 2008-11-21 15:20:58 | 显示全部楼层
呵呵

如果这样的话

比如第一天,采集200 发布 50

剩余 150 没有发

第二天又采集200 发布50

这个时候发布的50  是从 当天采集的200中产生,还是从第一天150未发+第二天200=350中产生呢?
发表于 2008-11-21 16:17:31 | 显示全部楼层
删除掉本地采集数据,每天都是采集当天的。
 楼主| 发表于 2008-11-21 16:21:57 | 显示全部楼层
如果 100个这样的任务呢?

今生同学,有功夫每日删除100下吗?

呵呵
 楼主| 发表于 2008-11-21 16:25:09 | 显示全部楼层
这样做的目的

比如:

每天自动跟踪  网易 地方新闻 网易 国际新闻  网易 社会新闻 栏目

因为都是网易的,规则全站通用,而为了避免蜘蛛 视我们为作弊

自从这些内容里面随机抽取一些发布就可以,不那么嫩  全部采集  

但是,问题就是 一随机,就把老的没有发布的也拿出来随机了

所以,提个建议,就是当日当次更新中随机产生
发表于 2008-11-21 16:26:51 | 显示全部楼层
难怪了,可以写个小程序辅助,每天定时自动整理所有任务数据库。
发表于 2008-11-21 16:39:19 | 显示全部楼层
小程序可以外挂火车吗?
发表于 2008-11-21 16:50:49 | 显示全部楼层
支持这个功能。
发表于 2008-11-21 16:56:09 | 显示全部楼层
建议可以多任务一起进行SQL处理,像我提到的这个一样,应该就可以。
http://bbs.locoy.com/spider-31506-1-1.html

[ 本帖最后由 覆雨翻云 于 2008-11-21 16:57 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 16:25

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表