亿玖资讯

Enine information
  • 亿玖动态
  • 行业资讯

加速企业级AI应用,IBM重磅推出全新Telum处理器与Spyre加速器!

发布时间:2024-09-05

随着人工智能技术的飞速发展,企业对于高效能、高安全性的AI解决方案的需求日益增长。在近期的Hot Chips 2024大会上,IBM公布了其最新技术创新的内容,包括IBM Telum II处理器和IBM Spyre™加速器的架构细节。这标志着IBM在AI企业级应用领域的重大突破,预示着大型主机系统处理能力的显著提升。

 

 

Telum II处理器:性能与效率的双重飞跃

Telum II处理器是IBM为下一代IBM Z系列主机量身定制的核心组件。它配备了八个运行频率高达5.5GHz的高性能内核,每个内核配备了36MB的二级高速缓存,使得片上高速缓存总容量达到了360MB,较上一代提升了40%。此外,每个处理器抽屉的虚拟L4高速缓存也增至2.88GB,同样实现了40%的增长。这些改进不仅提升了处理器的计算能力,还大幅增强了其在金融交易欺诈检测等场景中的AI推理能力。

 

IO加速单元:提升数据处理能力

 

除了Telum II处理器,IBM还发布了全新的IO加速单元(DPU)。这一单元集成在Telum II处理器芯片上,旨在加速大型主机上用于联网和数据存储的复杂IO协议。通过提高I/O密度50%,IO加速单元可以大幅提高数据处理能力,进一步提升IBM Z的整体效率和可扩展性,使其成为处理大规模AI工作负载和数据密集型应用的理想选择。

 

Spyre加速器:AI工作负载的强力支持

 

与Telum II处理器相辅相成的是IBM Spyre加速器,这是一款专为复杂AI模型和生成式AI用例设计的企业级加速器。Spyre加速器拥有高达1TB的内存,并能在普通IO抽屉的八块卡上串联工作,以支持大型主机的整体AI工作负载。每块卡的功耗被控制在75W以内,确保了能效比的优化。Spyre加速器的加入,使得IBM Z平台能够更高效地处理大规模AI工作负载和数据密集型应用。

此次的Telum II 处理器和 IBM Spyre 加速器,将由 IBM 的长期合作伙伴三星晶圆代工生产。采用5纳米工艺生产,为这些处理器和加速器提供了高性能和高能效的基础。这种先进的制造工艺不仅提高了芯片的性能,还有助于降低功耗,这对于数据中心和企业环境来说是一个重要的考量因素。

 

 

企业计算解决方案:安全节能与高性能

 

不仅如此,IBM主机和Linux ONE产品管理副总裁Tina Tarquinio强调,Telum II处理器、IO加速单元和Spyre加速器的推出,旨在提供安全、节能、高性能的企业计算解决方案。这些创新成果将被引入下一代IBM Z平台,帮助客户大规模利用大语言模型和生成式AI技术,以应对日益增长的AI计算需求。可以应用的场景包括:

金融交易欺诈检测:通过AI集成方法将大语言模型与传统神经网络相结合,以提高性能和准确性,增强对保险理赔欺诈的检测。

反洗钱高级监测:对可疑金融活动进行高级检测,支持遵守监管要求并降低金融犯罪风险。

AI助手:加速应用生命周期、知识和专业技能的传授、代码解释和转换等。

预计在2025年,Telum II处理器和Spyre加速器将向客户提供,为企业提供更多的选择,以支持他们在未来几年内的AI战略。

关键词:

相关推荐