- 亿玖动态
- 行业资讯
NVIDIA与Oracle合作,加速AI和大规模数据处理
发布时间:2024-09-18
在AI技术不断渗透各行各业的今天,企业对强大的计算资源的需求愈发迫切。NVIDIA与Oracle携手,推出了一系列创新技术解决方案,以满足市场对高效AI运算的迫切需求,同时促进数据处理速度和提高经济效益。
OCI Zettascale超级集群的创新
在Oracle CloudWorld大会上,Oracle展示了其最新力作——Zettascale OCI超级集群,由NVIDIA Blackwell平台驱动,配备超过十万个NVIDIA最新一代GPU,为企业AI工作负载和数据处理提供强大动力。该超级集群支持灵活部署,无论是本地、公有云还是主权云环境,都能轻松应对。
技术规格与扩展性
OCI超级集群在规模和性能上均超越了现有的超级计算机,其GPU数量是Frontier超级计算机的三倍以上,可扩展至131,072个Blackwell GPU,提供2.4 Zettaflops的惊人AI计算能力。这一成就得益于NVIDIA ConnectX-7 NIC和Quantum-2 InfiniBand网络的先进性能。预计到2025年上半年,基于Blackwell的系统将全面上市。
NVIDIA GB200 NVL72液冷裸机实例的突破
Oracle展示了NVIDIA GB200 NVL72液冷裸机实例,这是为生成式AI应用量身定制的解决方案。这些实例通过72-GPU NVIDIA NVLink域,实现单个巨型GPU的效能,支持大规模AI训练和实时推理。同时,OCI也宣布将推出NVIDIA HGX H200 Tensor Core GPU,进一步加速AI推理和训练。
NVIDIA L40S GPU加速实例的推出
Oracle针对中端AI工作负载推出了NVIDIA L40S GPU加速实例,并通过Roving Edge Device v2提供边缘解决方案,支持多达三个NVIDIA L4 Tensor Core GPU,确保即使在远程或离线环境中也能实现AI部署。
企业应用案例
AI新创公司Reka利用OCI超级集群开发多模态AI模型,这些模型能够处理复杂的企业代理任务,如听、说、读、看。Reka的模型展示了NVIDIA GPU加速基础设施的强大能力,能够高效地处理和扩展大规模模型训练。
GPU加速功能的展示
Oracle和NVIDIA展示了新的集成方案,旨在加速Oracle自治数据库上的生成AI工作负载。这些集成展示了NVIDIA GPU在增强Oracle数据库AI功能方面的潜力,包括加速向量嵌入、优化矢量图索引生成,以及通过NVIDIA NIM推理微服务提升文本生成和翻译能力。
NVIDIA与Oracle的合作不仅推动了AI训练和推理的效率,还为企业提供了一系列灵活的部署选项,从边缘到云端,全面覆盖。这种合作模式正在帮助全球企业和政府实现AI应用的突破,满足数据主权需求,加强经济韧性,并推动AI技术的持续创新和发展。通过这种合作,NVIDIA与Oracle正在引领AI和高性能计算的新纪元,为企业和政府的数字化转型提供强大支持。