新闻资讯

一文看懂2025GTC:AI推理时代到来,英伟达推出“算力核弹”

界面新闻记者 | 李彪

界面新闻编辑 | 文姝琪

美国时间3月18日,英伟达在美国圣何塞举办GTC(GPU技术大会)。作为全球最受关注的科技巨头,今年GTC吸引约2.5万人线下参加,另有30万人通过线上方式收看直播。

英伟达CEO黄仁勋在主题演讲开场说道,“因为AI技术爆发,GTC大会的规模每年都在扩大。去年他们说GTC是AI行业的‘伍德斯托克摇滚音乐节’。今年我们搬进了体育场,GTC已经成AI行业的‘超级碗’”。

而在此次GTC大会上,英伟达不仅发布了Blackwell GPU、硅光交换机、机器人模型等一系列新产品。黄仁勋还在演讲中反复传递出一个信号:随着AI行业在模型训练上的整体需求放缓,再加上DeepSeek在模型推理上所做创新,AI推理时代即将到来。

演讲结束后,英伟达股价收盘跌超3.4%,报115.43美元/股,盘后继续下跌0.56%。

Blackwell  Ultra GPU:专为AI推理打造的“算力核弹”

作为GTC的重头戏,黄仁勋在演讲中宣布推出数据中心AI GPU的新一代产品——NVIDIA Blackwell Ultra GPU。

此前市场传言英伟达去年年底计划将Blackwell Ultra改名为B300 ,但根据现场公布的结果,官方保留了原始命名。Blackwell Ultra GPU相比于上一代B200GPU性能提升了50%,约为15P FLOPS(基于低精度的四位浮点数格式FP4标准),内存上则搭载了业内更先进的HBM3E,从192GB升级到了288GB。

图源:英伟达

基于Blackwell Ultra,英伟达面向云计算厂商等大型企业客户客户提供两款系统集成产品:Blackwell Ultra NVL72机架式解决方案与NVIDIA HGX Blackwell Ultra NVL16系统。

其中,Blackwell Ultra NVL72是在一个数据中心机架(一台服务器搭载8个GPU,一个机架可以容纳多台服务器)中连接了72个Blackwell Ultra GPU以及36个英伟达基于ARM架构设计的Grace CPU。据与上一代B200GPU的同类产品相比,Blackwell Ultra NVL72在AI算力性能上提升超过了50%。HGX Blackwell Ultra NV16则是运用NVLink高速互联 *** 连接8个Blackwell Ultra GPU的服务器系统产品。

与A100、H100等多款主要用在AI模型预训练的产品不同,英伟达此次明确定位Blackwell Ultra“专为AI模型推理打造”(AI-Reasoning),同时兼顾"训练和多场景AI应用的高效性"。Blackwell Ultra NVL72和HGX Blackwell Ultra NVL16(8GPU)两款系统产品也在提升计算能力和内存容量的同时,专为复杂AI推理任务做了优化。以HGX Blackwell Ultra NVL16为例,相较于上一代Hopper架构,这款新品在大模型推理速度上提升了11倍。

此前在DeepSeek用极低的算力成本完成模型开发后,外界就曾担忧市场对英伟达算力芯片产品的旺盛需求是否会放缓,英伟达官方及黄仁勋就曾在多个场合表示,相比于AI厂商先前将大量算力投资用于AI模型训练上,DeepSeek主要在模型推理运用了创新技术,而AI推理依然需要大量英伟达GPU和高性能 *** 。

在AI行业的“Scaling Law”法则(模型规模越大,模型越智能)在预训练环节放缓后,推理环节将催生更大规模的算力需求,因此“DeepSeek的出现反而证明市场需要更多AI芯片”。

据黄仁勋介绍,Blackwell系列,目前已经全面投产。“产量惊人,客户需求惊人,因为人工智能出现了一个拐点,由于推理人工智能以及推理人工智能系统和智能体系统的训练,人工智能领域必须完成的计算量大大增加。”

按照英伟达“一年一更新”发布节奏,黄仁勋演讲中预告了下一代Rubin架构两款产品Rubin GPU、Rubin Ultra GPU的性能信息。

Rubin GPU算力性能将在FP4标准下达到50P Flops,约是Blackwell Ultra GPU的3.3倍,Rubin Ultra GPU则在相同标准下为100P。两款新架构产品届时也将用上HBM4、HBM4E先进AI内存。搭载Rubin GPU的Vera Rubin NVL144(连接144个GPU)将于 2026 年下半年推出,Rubin Ultra GPU的Rubin Ultra NVL576(连接576个GPU)将于2027年下半年推出。

继Rubin架构之后,黄仁勋现场公布下一代GPU架构的命名为“Feynman”,取自著名物理学家理查德・费曼(Richard Feynman),Feynman架构产品将于2028年发布。

智能体和机器人时代,AI将需要更多芯片

与去年GTC密集发布各种新产品的节奏不同,黄仁勋今年在公布新品前,在现场花了更多时间科普“Agentic AI”的概念,以及AI推理带来的巨大改变。

在现场展示的AI技术发展路线图中,黄仁勋按照“Generative AI(生成式AI)、Agentic AI(智能体)、Physical AI(具身AI)”三个阶段的进化路线,将Agentic AI描述为AI技术发展的中间态。

相比于生成式AI的主要应用——语言大模型与聊天机器人——主要聚焦于生成文本、图像内容,Agentic AI更进一步,能够理解任务、进行复杂推理、制定计划并自主执行多步骤操作,目前业内热议的数字员工等AI Agent即为相关应用。

图源:英伟达

在生成式AI的之一阶段,AI行业的“Scaling Law”法则集中体现在模型训练上,特别是预训练环节(Pre-Training,即从无到有开发模型的前期训练阶段),投入更多的数据、更大规模的算力资源训练出更好的模型,训练规模越大,模型越智能。

黄仁勋认为,从过去一年的行业发展进程来看,预训练为主的Scaling Law法则已走入“误区”。从今年乃至未来很长一段时间内,Agentic AI将代替生成式AI,成为行业新的发展方向。由于Agentic AI强调自主性与复杂问题解决能力,每一步解决复杂问题、分解任务的逻辑思考过程都需要用到“模型推理”,因此推理将成为新阶段的核心动力。

而从生成式AI发展到Agentic AI,并不意味着Scaling Law法则失效。相反,由于将应用范围从训练进一步扩展到推理,不只在预训练环节,模型的后训练(Post-Training,指预训练得到模型后,根据特定任务或需求,使用更小规模、更专注的数据集对模型进行进一步优化训练或微调的过程)和日常推理的长期思考(Long-Thinking)都要继续消耗算力资源,Scaling Law法则对规模的要求非但会变小,相反会进一步扩大。

以一个用户访问AI应用时产生的Token来举例,对于Agentic AI来说,推理所涉及的任务更加复杂,可能需要生成或处理更多Token来完成规划和执行。同时随着更多用户同时访问AI,Token的数量会爆炸式增加。对于大模型来说,每生成一个Token往往需要数千亿次浮点运算,如何在有限时间内尽可能多的生成Token,并快速将推理结果反馈给用户,大规模的算力资源是完成这一切的基础。

按照现场显示的效果,Blackwell Ultra NVL72集群在运行DeepSeek-R1 671B交互式副本时,只需10秒就可以给出答案,而上一代Hopper架构的H100同类产品则需要1分半。

此次大会上,英伟达还发布了一款新型的AI 推理服务软件Dynamo。它协调和加速数千个GPU之间的推理通信,并使用分解服务将大型语言模型的处理和生成阶段分离在不同GPU上。这允许每个阶段根据其特定需求进行独立优化,并确保更大程度地利用GPU资源。

黄仁勋认为,推理所需算力需求规模增长能“轻松超过去年估计的100倍”,未来行业需要更多、性能更强的AI芯片。根据他的预测,数据中心建设的投入到2028年将达到1万亿美元,目前“相当确定很快就会达到这个目标”。

硅光 *** 交换机、机器人模型与量子计算研究中心

此外,在今年GTC大会上,英伟达还将在硅光芯片、机器人应用、量子计算等领域有进一步的探索。

硅光领域,英伟达最新发布了NVIDIA Spectrum-X(基于以太网,适合兼容更广泛的企业 *** )及NVIDIA Quantum-X(基于InfiniBand,偏向专用计算集群)硅光 *** 交换机。

这两款硅光 *** 交换机新品是英伟达首次利用“光电共封装技术”(co-packaged optics, CPO)将光通信直接集成到交换机上,推出的商用化硅光交换机产品。此前英伟达的交换机产品的光通信部分主要为“外挂式”,依赖从Finisar和Lumentum等外部供应商采购的标准化模块。

此次英伟达的硅光 *** 交换机新品与台积电、Coherent、康宁公司(Corning)、富士康、Lumentum和SENKO等行业巨头合作。Quantum-X交换机预计将于今年晚些时候上市,Spectrum-X交换机预计于2026年通过主流基础设施和系统供应商推出。

黄仁勋曾经用“A工厂”描绘AI时代超大规模数据中心的未来形态。随着AI数据工厂规模的扩张, *** 基础设施也需要同步彻底革新。英伟达希望通过将硅光子技术直接集成到交换机中,突破超大规模和企业 *** 的传统限制,为目前万张、十万张GPU的数据中心向百万张GPU的AI工厂过渡奠定基础。

机器人作为未来“具身AI”(Physical AI)的关键应用,英伟达旗下辅助生成机器人训练数据的物理世界模型Co *** os、人形机器人基础模型GROOT N1以及3D实时仿真平台Omniverse是这一领域的主要产品。

图源:视觉中国

其中,GROOT N1是通用机器人基础模型,英伟达此次正式宣布已经将其开源。GROOT N1模型采用双系统架构,灵感来自人类认知原理。在视觉语言模型的支持下,一个系统可以推理其环境和收到的指令,从而规划行动。另一个系统然后将这些计划转化为精确、连续的机器人动作。

除硅光芯片与机器人应用外,在谷歌、微软相继在量子计算芯片领域有重大突破后,量子计算当前成为了硅谷科技巨头布局未来的一个热门方向。英伟达此次也在GTC大会上宣布,将在波士顿建设NVIDIA加速量子研究中心(NVAQC)。据官方介绍,该中心是一个以研究为导向的机构,将通过尖端技术推动量子计算架构与算法的发展。

值得关注的是,去年谷歌发布的Willow芯片攻克困扰量子计算研究30年的“量子纠错”难题,市场升温带动量子计算概念股上股价涨,黄仁勋曾在今年1月接受分析师采访时给量子计算的落地“泼了一盆冷水”:要造出“非常有用的量子计算机”,可能需要20年。黄的这一评价当时导致一众量子计算相关股票应声下跌。

黄仁勋在谈及英伟达成立量子研究中心的目标时提到,量子计算的实用化依赖于解决关键技术挑战,如量子比特噪声和纠错。而NVAQC的使命是推动这些突破:“NVIDIA加速量子研究中心将是突破发生的地方,以创建大规模、有用的加速量子超级计算机。”

对于市场担忧量子计算颠覆现有计算工具,以前所未有的计算速度在密码学、隐私数据保护领域形成“量子霸权”,黄仁勋明确表示,量子计算不会单独取代现有的计算技术,而是作为AI计算能力的补充。未来的量子计算将成为AI超级计算机的“增强工具”,在药物开发、新材料制造等特定高复杂性领域发挥作用。

  • 港股一季度回购额超400亿港元,腾讯蝉联榜首
  • 推动沪克两地“算力结对”合作,这场推介会在上海举行
  • 新高不断!金饰价格突破每克1000元,下一目标位是?
  • 【海报】这些大咖,共商大模型高水平开发与应用
  • 关税卡住美国牛肉,澳州牛肉喜迎上位
  • 美政府要求哈佛大学提供有关外国资金和关系记录
  • 白宫称在停火前提下或与俄建立经济伙伴关系
  • 丽世酒店集团开启扩张计划,夏秋航季中韩航线恢复进程持续加速 | 一周旅行指南
  • Allegro大跌9.2%安森美半导体撤回70亿美元收购要约
  • 又有权益老将或离职,景顺长城百亿基金经理鲍无可四只产品增聘
  • 李强出席中国发展高层论坛2025年年会开幕式并发表主旨演讲
  • 美财长与马斯克权力博弈胜出 国税局代理局长遭撤换
  • 特朗普昔日搭档彭斯:本届政府加征关税是“失策”
  • 宋志平:人力资本和金融资本应共享企业财富
  • 赣商总会在赣州于都召开理事会,塑造当代赣商品牌
  • 首季度利润翻超10倍,中船防务2025年迎来估值“春天”?
  • 华尔街日报解析:为什么只有中国能成为苹果的供应链中心?
  • 看图学习丨开启新的“黄金50年”习主席为中马关系擘画蓝图愿景
  • 昆明边检将国家安全教育融入出入境管理全流程
  • 深化应用型人才培养,这所高校聘任行业企业专家深度参与专业设置
  • AI重塑工作流 三七互娱2024年营收净利双增
  • 内幕交易“同力日升”亏损19万元,一散户被罚款200万元
  • 周末影响市场重要资讯回顾:中方将不予理会美方继续关税数字游戏 特朗普大厦用价签遮盖中国制造
  • 万人说新疆|热爱家乡的“石榴籽”
  • 高盛:升绿城中国目标价至12.5港元 评级“买入”
  • 派2万名警察、发紧急令,韩国对尹锡悦案判决严阵以待
  • 具身智能产业化发展座谈会举行 科技新贵与资本市场共谋具身智能万亿级赛道新机遇
  • 美国财政部讨论是否放松关于美国国债的资本监管规定
  • 何以中国|下梅村与万里茶道的百年回响
  • 因罗博特科并购重组信披违规,东方证券及项目主办人遭深交所书面警示
  • 私募MOM升温!年内已有22只产品完成备案,头部量化私募受青睐
  • Pimco:特朗普关税“自找”供给侧冲击 美国市场恐重演英国脱欧式动荡
  • 反制关税霸凌,中方将邀联合国成员国召开安理会会议
  • “青春版提案”点亮百年名校,《政协联线》电视专栏今年第7期将播出
  • 提升青春期+亲子含量:社区商业综合体这样用好“二次元”
  • WTO警告全球货物贸易将萎缩,但亚洲进出口增长
  • 一周新车盘点 | 腾势上市新旗舰SUV 长安逸动增插混车型
  • 抖音“黑马”柳丝木靠50元的主力产品,一年卖出15亿
  • 哈马斯称与一名美以双重国籍被扣押人员失去联系
  • 中天策略:4月17日市场分析
  • 农业农村部原部长唐仁健将在长春受审,曾被批“在脱贫攻坚中搞盲目决策”
  • 德国候任总理:特朗普的关税政策恐引发金融危机 倡导欧美自由贸易
  • 北京轨道交通已全线恢复正常运营
  • “利率高地”也撑不住了,过半民营银行4月降息
  • 受益旅游行业复苏,三特索道净利增11.34%至1.42亿,营收承压
  • 证券公司并表管理指引落地,多家试点券商火线解读
  • 乐普医疗连续两年净利润同比下滑 去年药品收入同比下滑42%
  • 突发!35岁苏炳添100米半决赛弃权!此前曾称“可能是自己的百米告别战”
  • 从6家试点扩展至全行业,券商并表监管有何看点?
  • 用户办“云手机”业务未满月就被终止,广西联通称系商业测试发现技术问题后下架
  • 伊朗外长:伊美第三轮会谈将于26日在阿曼举行
  • 和评理|全球深化合作抵制美国宰割
  • 乌美签署矿产协议备忘录,美国坚持优先拿走开采收益
  • 上海是他永远倾心的城市,“黄永玉新作”在沪展出
  • 前方后方·东盟年轻人在看哪些中国影视剧?
  • 大张旗鼓加税,偷偷摸摸豁免——起底美国政府的“神操作”
  • CNBC调查:特朗普在经济方面的支持率降至其总统任期内的最低水平
  • 王力宏突发意外脸部烧伤?工作室紧急回应
  • 华农保险“老帅”离任 股权质押、保费下滑难题待解
  • 上海徐汇探索AI赋能城市治理,面向全球招募量子城市解决方案
  • “杭州六小龙”开始走进直播间
  • 谁在向张福生行贿?
  • 寺庙餐饮,被年轻人追捧成新顶流
  • 热点涌现!A股并购重组持续活跃
  • 一场小型越野赛为何吸引众多越野大神打卡?
  • 突发!比特币带头,全线跳水!近12万人爆仓!特朗普又传大消息!
  • 中共中央国务院印发《关于实施自由贸易试验区提升战略的意见》
  • 特朗普政府要求哈佛大学提供关于从外国来源所获资金的记录
  • 关税冲击下的佛山家居厂商:订单暂缓、海外设厂和投放新市场
  • 天津博物馆五一开展,八省文物呈现北朝风貌
  • 4月12日:玉米价格最新行情
  • 每日复盘|市场再创阶段“地量”,沪指止步八连阳
  • 光大期货0414热点追踪:氧化铝修复性上行,警惕过度追涨
  • 中国地质调查局原局长钟自然被判13年,其中因故意泄露国家秘密领刑2年
  • 特朗普怒批哈佛立场 威胁撤销该校免税资格
  • 武契奇称“颜色革命”已结束,外国势力攻击不会得逞
  • 基本面 | 2023年社会消费品零售总额增长7.2%由负转正,较上年提升7.4个百分点
  • 中小商家的春天:拼多多普惠千亿如何激活“沉默的大多数”
  • 陈芋汐、全红婵包揽跳水世界杯加拿大站女子10米台冠亚军
  • “对等关税”下的汇率图景:美元指数跌破100关口,投资者涌向日元、瑞郎
  • 此轮大风过程极端性强,北京8个国家站突破建站以来同期极值
  • 碧桂园2024年亏损收窄82.5%,累计交付房屋38万套
  • 券商员工考公“上岸”潮升温:高压竞争与转型阵痛催生双向选择
  • 【侨一瞧】马尔代夫驻华大使法泽尔·纳吉布:中国在关税战中彰显的领导力令人鼓舞
  • 汽车早报|特朗普称正在考虑免除汽车零部件关税;特斯拉上海超级工厂焕新版Model Y首次批量出口
  • 时隔半月,成都土拍楼面成交价再创纪录,首破4万元/平方米
  • 开盘:美股小幅低开 市场聚焦关税战最新发展
  • 工伤保险异地就医直接结算全面实施
  • 艺术开卷|从四百年前的《十竹斋书画谱》看版画与绘画的交流
  • 【专访】Snow Peak中国区CEO:希望消费者提到“飞钓”,就想到我们
  • 100年前美国大加关税,最后怎么收场?
  • 美悄然豁免部分消费电子产品关税,苹果等科技巨头或受益
  • 玉渊谭天丨这是一个时代的结束
  • 原油:油价小幅下跌 贸易战动荡加剧了供应过剩担忧
  • 中再产险与太保产险完成场内交易签约
  • 中国进出口银行成功发行服务外贸提质增效和支持外贸基础设施互联互通主题金融债券
  • 支持企业保持战略定力、坚定发展信心、增强战略敏捷!陈吉宁龚正走访调研外贸外资企业
  • 美媒:特朗普在经济问题上的支持率降至其总统生涯以来的最低水平
  • 关税压力下的服装外贸人:“这个时候更要进取”
  • 美伊重启核谈判,伊朗货币与股市上扬
  • 商务部新闻发言人就美方豁免部分产品的“对等关税”答记者问
  • 养老“黑科技”亮相消博会:从助眠到陪伴,扛起30公斤重物也不是问题
  • 王志忠获任国家移民管理局局长,许甘露卸任
  • 中超浙江队外援布彭扎坠亡,警方通报:排除刑事案件
  • 关键词: