火车采集器V2008版更新[2008-08-08][火车车厢管理制度]论坛活跃、奖励计划http://domain.locoy.com火车采集器高级版本在线订购高级版本功能及技术支持列表
返回列表 回复 发帖

建议官方:1.04试用手记

首先,肯定地说,你们的采集软件非常好。
想提个建议,改进一下:
情景:
我们经常采集的页面是这样的:左边是本类中的热门内容,假设是20条,右边实质内容,每页30条,共100页,而且,这30条内容地址编号不是连续的

问题:采集100页,左边的热门内容每页都一样,要重复采集100此,还很难删除掉

请问官方有没有好方法?

如果有,那我下面的建议可以忽略。

我的建议:
1。集成ubb贴图工具,这个在网上可以找到。有个特点是可视化过滤网址
如,你需要的是右侧的30条,那么,右健选中这个区域,复制到这个ubb工具的页面,他自动提取网址,这样就没有左侧热门的干扰。  缺点是只能一页一页的复制,希望你们能借鉴一下,并应用到这个采集其中

2。热门的20条地址其实会在一起,那么,设定第一条的地址和第20条的地址,就可以把这20条给屏蔽掉,连续采集时就不会有问题了

希望考虑一下,好软件,大家支持
附件: 您所在的用户组无法下载或查看附件
http://www.kulela.com http://www.midoo.com
我现在是通过手动把所有连接找出来,结果还是出现重复入库,希望官方的数据库入库早点开发完成呀。
下面是引用kevinwei于2005-12-16 23:58发表的建议官方:1.04试用手记:
首先,肯定地说,你们的采集软件非常好。
想提个建议,改进一下:
情景:
我们经常采集的页面是这样的:左边是本类中的热门内容,假设是20条,右边实质内容,每页30条,共100页,而且,这30条内容地址编号不是连续的

.......
呵呵。。这一点软件自己有方法做到。。。

使用页面内选定区域采集网址功能,从***到***。只采集页面内文章列表一块内的连接。。可以屏蔽掉重复采集页面内热门列表
下面是引用火车头于2005-12-17 19:23发表的:




呵呵。。这一点软件自己有方法做到。。。
.......
这个从...到...,是递增关系吗?

还是区域类的起始到结束呢?


呵呵,我还是试试再看.


还有,做排除比较好,如果有100页,要设置100次从...到...吗?如果是排除的话,那么每页排除的都一样亚,是不是这个道理
http://www.kulela.com http://www.midoo.com
在下图中筛选
附件: 您所在的用户组无法下载或查看附件
一看就知道楼主没仔细看这个软件.页面范围可以设定的 [s:7]
返回列表
售前客服QQ: 火车采集器客服 rq204, 火车采集器客服 飞越无限火车采集器客服 孤魂火车采集器客服 尘缘, 联系电话:0551-3495249(技术合作问题) 023-58436018 (08:00-20:00-客服),0752-2553545(09:00-20:00-客服)