6月11日消息,微软与英伟达携手合作,宣布在即将发布的Windows Server 2025系统中推出全新功能——GPU分区(GPU Partitioning)。这项创新技术将赋予多台虚拟机共享和使用物理单片GPU的能力,为人工智能工作负载提供前所未有的性能提升和灵活性。
援引微软官方描述,GPU Partitioning 技术旨在改变虚拟机利用 GPU 资源的方式,Windows Server 系统可以将单个物理 GPU 分割成不同的分区,每个分区都能调用部分 GPU 性能。
用户可以自由指定 Windows Server 设备的 GPU 性能,不再要求将整个 GPU 专用于单个虚拟机,而是可以高效地共享 GPU 性能,好像每个分区都是一个独立的 GPU。
该技术还使用名为“故障转移集群”(failover clustering)的技术,如果一个服务器节点上的虚拟机遇到硬件故障或需要迁移,它可以重新启动集群中的另一个节点,并使用另一个服务器上的 GPU 分区。
微软还在构建集中式管理工具,以便管理员更轻松地配置和监督这种新的 GPU 虚拟化设置。Windows 管理中心用户界面将提供一个统一的控制台,用于查看整个集群环境中 GPU 分区的详细信息,并根据需要将这些分区分配给虚拟机。