发新话题
打印

[3.2版] 强化火车头(自动采集功能建议)

强化火车头(自动采集功能建议)

现在cms后台采集都已经很多在搞自动采集的插件了.

火车头拥有这么好的基础,能否考虑加强对目标站的目标栏目列表进行跟踪自动采集.那就不需要每次都手工添加列表了.



应该很多人需要这样的功能的

TOP

企业版应考虑一下这功能..

TOP

程序我不会,概念上就循环获取列表,判断排除已经采集的列表

^_^
老大,是这样吧

TOP

自动更新就可以了啊,会排除已采集的列表

TOP

但如果别人人网站,新添加了资源,列表新增加了,还是需要人去更新列表吧?


那个自动更新我也没有用过了.不知道我的看法正确否

TOP

只要自动更新到特定时候开始启动了
采网址的时候有过滤列表的功能啊,重复的网址当然不会采,而只采新的

TOP

引用:
原帖由 菜鸟开火车 于 2007-9-15 02:24 发表
但如果别人人网站,新添加了资源,列表新增加了,还是需要人去更新列表吧?
在添加列表的时候多放几页,比如列表页只有5页,但在添加任务的时候填写成1-10页,这样就不用每次都更新列表了。

TOP

引用:
原帖由 火车头 于 2007-9-15 07:04 发表
只要自动更新到特定时候开始启动了
采网址的时候有过滤列表的功能啊,重复的网址当然不会采,而只采新的
重复的是不会采集,这个我知道的.

我的意思是这样的.


假设,
采集栏目a1.html-a10.html
这个列表的时候,要是系统能自动跟踪,定期的自动增加a11.html-a12.html这样自动采集这样,

而不是需要在第2次采集人工添加a11.html-a12.html这样,能自动跟踪栏目来添加列表更新,这样才算自动化吧^_^

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.196612 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-23 18:29 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档