英伟达(nvidia)正式宣布收购开源工作负载管理平台slurm的核心开发公司schedmd,将这一支撑全球顶尖超算系统与大规模ai集群运行的关键调度基础设施纳入自身技术生态。与此同时,英伟达明确承诺:收购完成后,slurm将继续以完全开源、永久免费的方式向全球开发者与企业开放使用。
Slurm是一款专为Linux集群环境设计的开源作业调度系统,具备从数十台服务器到百万级计算核心的弹性扩展能力。其核心功能涵盖资源分配、任务调度、节点状态监控等关键环节,目前已被全球超过半数的TOP100超级计算机所采用。在AI大模型训练场景中,Slurm尤其擅长在多GPU及异构计算架构下实现硬件资源的高效协同与利用率最大化。

延伸阅读:
AI教母李飞飞面试工程师不看学历 只看这件事
标签: linux 计算机 工具 nvidia ai 英伟达 自然语言处理 大模型 ai大模型
还木有评论哦,快来抢沙发吧~