- 亿玖动态
- 行业资讯
英特尔发布Gaudi 3:对标英伟达H100,预计Q2向OEM厂商出货|最前线
发布时间:2024-04-15
声明:本文转载自公众号36氪的《英特尔发布Gaudi 3:对标英伟达H100,预计Q2向OEM厂商出货|最前线》by 邱晓芬 、苏建勋
“英特尔Gaudi 3将于2024年第二季度面向OEM厂商出货。”
美国当地时间4月9日,英特尔举办了面向客户和合作伙伴的英特尔on产业创新大会。毫无预兆,这场大会上,英特尔首次介绍了他们的GPU产品Gaudi 3,向英伟达发起冲击。
尽管英伟达在数日前的GTC上已经发布了最新的Blackwell架构的GPU,英特尔Gaudi 3在具体的参数上,瞄准了英伟达更早之前的主力产品H100。
据介绍,英特尔Gaudi 3将带来4倍的BF16 AI计算能力提升,采用128GB HBMe2内存,支持1.5倍的内存带宽提升,采用5nm制程制造。此外,这颗芯片能够支持多种的大模型,包括Llama、文生图的Stable Diffusion、语音识别的Whisper等等。
英特尔副总裁Das Kamhout表示,若应用在70亿、130亿参数Llama2模型,甚至1750亿参数GPT-3模型上,相比于英伟达H100,采用英特尔Gaudi 3时的大模型训练时间缩短50%,推理时间缩短40%,同时能耗、成本的表现也更好。
不过,英特尔公司首席执行官帕特·基辛格也高调呛声,称Gaudi 3的性能将与英伟达H200相当,甚至在某些领域的性能甚至更好。不过,他在发布会上暂时没有拿出对比数据,也并未就此展开说明。
在GPU中,网络连接也是一项关键重点。在英特尔Gaudi 3中,英特尔采用的是以太网网络,也允许企业灵活地从单个节点,扩展到拥有数千个节点的集群、超级集群和超大集群,支持大规模的推理、微调和训练。
英特尔方面称,英特尔Gaudi 3将于2024年第二季度面向OEM厂商出货,名单包括戴尔、HPE、联想等。值得注意的是,在英特尔Gaudi 3发布后,目前AI芯片市场也呈现出三足鼎立的局面——英伟达B200、AMD MI300系列和英特尔Gaudi 3。
在英特尔Gaudi 3发布之后,英特尔的AI生态系统也凑齐。目前看来,AI PC、Edge AI(边缘)、和Data Center AI(数据中心)是英特尔的三大AI计算生态系统,次次发布会上,英特尔也做出了产品更新。
面向数据中心、云和边缘侧,英特尔发布了至强6处理器,具体包括两款新产品——这也是英特尔这一产品系列时隔数月之后的又一次更新。
其中,配备能效核的英特尔至强6处理器(代号为Sierra Forest),与第二代英特尔至强处理器相比,每瓦性能提高2.4倍,机架密度提高2.7倍,将于2024年第二季度推出。
配备性能核的英特尔至强6处理器(代号为Granite Rapids),与使用FP16的第四代英特尔至强处理器相比,可将token的延迟时间最多缩短6.5倍,能够运行700亿参数的Llama-2模型。在AI PC和端侧层面,英特尔也更新了几款新产品。
英特尔宣布将于2024年推出的下一代英特尔酷睿Ultra客户端处理器家族(代号Lunar Lake),处理器将具备超过100 TOPS平台算力,在神经网络处理单元(NPU)上也将带来超过46 TOPS的算力,从而为下一代AI PC提供强大支持。
另外,英特尔也发布了涵盖英特尔酷睿Ultra、英特尔凌动处理器和英特尔锐显卡系列产品在内的全新边缘芯片。这些产品主要面向零售、工业制造和医疗等关键领域,所有新品将于本季度上市。
不过,AI的落地只有芯片还不够,还要有更完整的AI生态的加持,根据cnvrg.io的调研结果,2023年只有10%的企业成功将其生成式AI项目产品化。为了改变现状,此次发布会上,英特尔还宣布和多家企业合作,为企业AI创建一个开放平台。
在这一平台上,通过检索增强生成(RAG),企业用户能够通过开放的LLM功能,更容易部署生成式AI。
英特尔公司首席执行官帕特·基辛格表示,“从PC到数据中心再到边缘,英特尔正在让AI走进千行百业。英特尔最新的Gaudi、至强和酷睿平台将提供灵活的、可定制化的解决方案,满足客户和合作伙伴不断变化的需求,把握住未来的巨大机遇。”
“我们即将再次改变世界”——这是帕特·基辛格在发布会上留下的最后一句话。
转载的原文链接:https://mp.weixin.qq.com/s/46YknlQ9o5GR5VU03l8iBg