IT资讯 戴尔开源 Omnia,用于管理 HPC 和人工智能工作负载

rhodes · 2021-06-29 09:30:06 · 热度: 20

戴尔公司近日宣布,其用于管理高性能计算(HPC)和人工智能工作负载的开源软件 Omnia 已经正式推出。虽然这一消息是近日才正式宣布的,但 Omnia 自今年年初以来就已经登陆 GitHub 了。

戴尔开源 Omnia,用于管理 HPC 和人工智能工作负载

Omnia 由戴尔 HPC、英特尔和亚利桑那州立大学联合开发,能够让客户更容易管理高性能计算、人工智能和数据分析工作负载。

Omnia 的工作方式是将软件解决方案自动印在被分配给相关工作负载的每台服务器上。戴尔表示,这有助于将各种融合工作负载(如 HPC 模拟、人工智能的神经网络或数据分析的内存图形处理)的部署时间从几天缩短到几分钟。

戴尔产品营销副总裁 Caitlin Gordon 解释道,该平台可以自动下载和安装开源软件,如集群管理、应用程序执行、加速器驱动程序、框架、应用程序和平台,它还可以管理运行 Slurm 或 Kubernetes 的系统。

Omnia 可以将集群部署到已经有基于 RPM 的 Linux 操作系统的服务器上,并且全部连接到互联网。一旦服务器拥有正常运行的操作系统和网络,用户就可以使用 Omnia 来安装和启动 Slurm 和/或 Kubernetes。

Omnia 将从以下来源安装软件,其中包括:

软件与硬件要求:

  • 管理节点上安装的操作系统:CentOS 7.9 2009;
  • Omnia 在裸机服务器上部署的操作系统:CentOS 7.9 2009 Minimal Edition;
  • Cobbler:2.8.5;
  • Ansible AWX:15.0.0;
  • Slurm 工作负载管理器:20.11.2;
  • Kubernetes 控制器:1.16.7;
  • Kubeflow:1;
  • Prometheus:2.23.0;
  • 支持的 PowerEdge servers:R640、R740、R7525、C4140、DSS8440 和 C6420;

而且由于 Omnia 是开源的,因此它会在 HPC 等开发者社区的帮助下不断成长,用户也根据自己的需要来改造它。亚利桑那州立大学不光是 Omnia 的贡献者,也会是第一批部署 Omnia 的院校。

猜你喜欢:
暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册