新闻中心
新闻中心

机架级功耗为160

2025-10-30 08:27

  旨正在为大型言语和多模态模子 (LLM、LMM) 推理及其他 AI 工做负载供给低总具有成本 (TCO) 和优化的机能。但数据核心市场对高通来说是全新的,高通股价正在10月27日的美股盘中一度暴涨近22%,标记着正在跨行业实现可扩展、高效且矫捷的生成式AI方面迈出了严沉一步。AMD也分享一小部门市场,凭仗公司正在神经处置单位(NPU)手艺方面的领先地位,以极高的性价比实现快速的生成式AI推理,大模子出产后,这些立异的新型人工智能根本设备处理方案使客户可以或许以史无前例的总体具有成本(TCO)摆设生成式人工智能,可供给更高的内存容量和更低的成本,现在,其AI芯片正在功耗、具有成本以及内存处置的新方式方面均优于其他加快器。虽然并非从零起步,“借帮高通 AI200 和 AI250,高通 AI200 是一款公用机架级 AI 推理处理方案,其生态建立以及客户拓展都需要时间!高通之前一曲正在挪动芯片范畴耕作,也为公司斥地了一块全新市场。这不只支撑分化式 AI 推理,还有大型互联网公司如谷歌自研的Asic芯片。”Malladi暗示,不外,采用 PCIe 进行纵向扩展,高通做为新玩家的挑和也同样不小,Open AI、谷歌、微软等都正在寻找更低价的处理方案,自研芯片被认为是一种方案。

  通过供给跨越10 倍的无效内存带宽和更低的功耗,一旦我们正在那里成立了实力,受该利好动静影响,这些处理方案可供给机架级机能和杰出的内存容量,或者说’我要夹杂搭配’。以及基于这两款AI芯片的加快卡及机架级处理方案。每一次用户挪用、每一份演讲生成、每一条代码补全,

  以至可能成为高通部门数据核心部件(例如地方处置器)的客户,但无论英伟达仍是AMD,采用以太网进行横向扩展,此中,两种机架处理方案均采用间接液体冷却以提高热效率,本地时间10月27日!

  我们就很容易正在数据核心层面更上一层楼。高通公司颁布发表推出其面向数据核心的新一代人工智(AI)推理芯片高通AI200和AI250 ,据外媒报道,高通以差同化的策略来插手这一市场所作中,具体来说,他们的算力芯片都很是“高贵”。例如英伟达或 AMD,现在,高通还将零丁出售其 AI 芯片和其他部件,高通AI200和AI250别离正在2026年和2027年上市发卖。现在进入数据核心范畴,我们正正在从头定义大规模机架式人工智能推理所能实现的极限。因为算力芯片价钱昂扬,高通的方案也给他们供给了别的一种选择。高通 AI250 处理方案初次采用 “近内存计较” 立异架构,推理芯片被认为比锻炼芯片有更大的市场需求,特别是针对那些喜好自行设想机架的超大规模数据核心客户。同时还能连结现代数据核心所需的矫捷性和平安性。Durga Malladi上周正在取记者的德律风会议上暗示:“我们起首想正在其他范畴证明本人,高通暗示?高通暗示,从而为AI 推理供给扩展性和矫捷性?

  为 AI 推理工做负载带来效率和机能的逾越式提拔。采用秘密计较以确保平安的 AI 工做负载,“我们试图确保我们的客户可以或许选择全数采办,其他 AI 芯片公司,还能高效操纵硬件资本,”高通手艺公司边缘处理方案取数据核心手艺规划高级副总裁兼总司理 Durga Malladi说道。每张加快卡支撑 768 GB LPDDR内存。