菜鸟开火车 发表于 2007-9-14 12:20:28

强化火车头(自动采集功能建议)

现在cms后台采集都已经很多在搞自动采集的插件了.

火车头拥有这么好的基础,能否考虑加强对目标站的目标栏目列表进行跟踪自动采集.那就不需要每次都手工添加列表了.



应该很多人需要这样的功能的

rq204 发表于 2007-9-14 12:27:09

企业版应考虑一下这功能..:lol

菜鸟开火车 发表于 2007-9-14 12:27:40

程序我不会,概念上就循环获取列表,判断排除已经采集的列表

^_^
老大,是这样吧

火车头 发表于 2007-9-14 12:39:47

自动更新就可以了啊,会排除已采集的列表

菜鸟开火车 发表于 2007-9-15 02:24:32

但如果别人人网站,新添加了资源,列表新增加了,还是需要人去更新列表吧?


那个自动更新我也没有用过了.不知道我的看法正确否

火车头 发表于 2007-9-15 07:04:31

只要自动更新到特定时候开始启动了
采网址的时候有过滤列表的功能啊,重复的网址当然不会采,而只采新的

vincentlong 发表于 2007-9-15 08:44:05

原帖由 菜鸟开火车 于 2007-9-15 02:24 发表 http://bbs.locoy.com/images/common/back.gif
但如果别人人网站,新添加了资源,列表新增加了,还是需要人去更新列表吧?


在添加列表的时候多放几页,比如列表页只有5页,但在添加任务的时候填写成1-10页,这样就不用每次都更新列表了。

菜鸟开火车 发表于 2007-9-15 12:59:29

原帖由 火车头 于 2007-9-15 07:04 发表 http://bbs.locoy.com/images/common/back.gif
只要自动更新到特定时候开始启动了
采网址的时候有过滤列表的功能啊,重复的网址当然不会采,而只采新的



重复的是不会采集,这个我知道的.

我的意思是这样的.


假设,
采集栏目a1.html-a10.html
这个列表的时候,要是系统能自动跟踪,定期的自动增加a11.html-a12.html这样自动采集这样,

而不是需要在第2次采集人工添加a11.html-a12.html这样,能自动跟踪栏目来添加列表更新,这样才算自动化吧^_^
页: [1]
查看完整版本: 强化火车头(自动采集功能建议)