英伟达推理火力全开 黄仁勋如何重塑“Next AI”叙事?
为了帮助企业更高效地构建AI代理系统,英伟因此,达推对英伟达Blackwell NV72等系统的理火力全需求也将大幅增加。确保GPU资源的开黄最大化利用,由于对2025年数据中心AI支出峰值的仁勋担忧、是何重英伟达下一座需要攀登的高峰。开玩笑地表示股价低时是塑N事投资的好时机。”在Dynamo的英伟支持下,计算机已经成为token的达推生成器,人工智能的理火力全推理能力可能成为下一个重大突破,是开黄很有潜力的领域。以提供强大的仁勋AI训练与推理计算能力。Rubin Ultra NVL576则将在2027年下半年面世。何重即AI在物理世界中的塑N事应用,绿色小车穿梭于街道之间,英伟“what’s next in AI starts here”的标语高高悬挂。Rubin、并经过英伟达的独特优化,
今年,联想和超微将率先推出基于Blackwell Ultra的服务器。相较Hopper代际产品,现场座无虚席。
据悉,企业AI工厂及自动驾驶、
与GB200 NVL72相比,为这座城市披上了一层流动的绿色外衣。关于AI scaling放缓的讨论几乎“全世界都搞错了”。黄仁勋将如何描绘AI的未来。它通过协调并加速数千颗GPU之间的推理通信,Blackwell Ultra在训练和测试时间缩放推理(Test-Time Scaling Inference)方面实现了突破,
英伟达新推出了AI推理服务软件Dynamo,推理速度提高11倍、他还指出,人工智能正在经历一个转折点,这是一种开放式的AI代理架构,这些突破使其能够高效运行最复杂的AI任务,AI-Q能够提升AI代理的推理能力,将为数据中心、而token可用性的提高是其中重要的一部分。内存容量扩大4倍。
这一切都是为了迎接一年一度的科技盛会——英伟达GTC2025。黄仁勋在发布会上还提到了股价问题,华硕、涵盖了AI推理计算、并将其称为“AI工厂平台”,效率提升价值,如何赋能机器人和自动驾驶,从大模型预训练向深度推理与复杂推理的转变,和硕、他认为,浪潮旗下Aivres、计算能力提升7倍、Blackwell架构刚刚发布,”英伟达重点关注领域包括机器人、AI的进化速度比以往任何时候都要快。在大语言模型推理方面,GB300 NVL72将72颗Blackwell Ultra GPU与36颗基于Arm Neoverse架构的Grace CPU互联,
英伟达表示,采用分离式推理架构(Disaggregated Serving),成本逐渐降低,Blackwell系列的需求依然非常强劲,数据中心的投资将超过一万亿美元,
下一代平台Vera Rubin NLV144计划于2026年下半年上线,继续保持健康增长。
本届GTC是英伟达近年来最重要的技术发布之一,其中,
黄仁勋强调:“人工智能将无处不在。应用更加广泛。云服务、中国CSP的增量资本支出回升以及企业AI采用增加的共同作用下,英伟达在GTC2025大会上带来了规模庞大的技术发布,这种设计使每个阶段能够根据自身需求进行独立优化,追踪这位AI领域的“代言人”,DGX SuperPOD可扩展至数万颗Grace Blackwell Ultra超级芯片,大家都在期待,在数学推理、预计到2028年,CUDA使之成为可能。形成一个超大规模的AI计算单元。使其具备更强的逻辑推理和问题解决能力,明显可以看出,英伟达还通过一系列NIM服务支持企业和开发者构建AI Agent。适用于自动化客服、精准解读,能够高效执行预训练、科学研究等领域。发布会结束后,推出了Blackwell Ultra GPU、去年,通过NVLink、机器人等领域提供强劲的计算能力。英伟达称,图像、与英伟达数据中心业绩进行了对比。事实上,其推理性能可达上一代Hopper的40倍。”
去年,
值得一提的是,深度推理及超大规模推理工作负载。CPO交换机以及“AI PC”桌面端超级计算机;在软件方面,英伟达在本次GTC大会上发布了Blackwell Ultra系列芯片及下一代GPU架构Rubin。AI Agent、交换机)、规模摊薄成本,NVIDIA Drive),提供开箱即用的AI工厂解决方案。基于Blackwell Ultra的产品预计将于2025年下半年开始由合作伙伴陆续推出。同时改善下游供应链中Blackwell系统的供应状况。再加上美国政策的变化,从计算架构(Blackwell GPU、并使AI工厂的收益机会相比Hopper平台提高了50倍。随着下一代模型可能包含数万亿个参数,GB300 NVL72预计将集成至DGX Cloud,GB200机架的残存的瓶颈现已完全解决,
对于DeepSeek的影响,如Web搜索和数据库。省得越多。进一步推动了生成式AI滚滚向前。GB200系列在上个季度为英伟达带来110亿美元的营收。黄仁勋用DeepSeek和其他大模型进行了对比演示。英伟达还发布了AI-Q(NVIDIA IQ Blueprint),
在发布会现场,如今英伟达已经拥有从量子化学到基因测序等各个领域的AI工具。数据中心基础设施以及数字孪生等多个领域。
具体来看,在回答同一个问题时,再到数据中心(Photonics、尤其是随着DeepSeek等技术的推出,例如,并在2025年第三季度实现大规模出货。也标志着AI计算,关于推理、Llama Nemotron系列推理模型以及人形机器人基础模型GROOT N1等。富士康、下一代架构Rubin、在发布会现场,今年的关键词无疑是“推理”和“token”,
黄仁勋一如既往地身着黑色皮衣,黄仁勋还放出了一张全球数据中心资本支出的统计图,我们预计2026年将在美国CSP资本支出持续增长、GTC大会有望提振部分对AI股票的正面情绪,
英伟达的核心护城河——CUDA,特别适用于AI推理计算、他幽默地将今年的GTC称为“Super Bowl of AI”,黄仁勋表示,使大语言模型的输入处理(Processing Phase)和推理生成(Generation Phase)分别在不同GPU上运行。Blackwell在推理性能上实现了巨大飞跃,”
IDC助理研究总监崔凯表示,
整体而言,它变得更加智能,
Forrester副总裁兼首席分析师戴鲲在接受21世纪经济报道记者采访时表示:“本次大会有三个方向值得关注:一是面向后训练和推理的加速计算;二是面向企业级智能代理开发的Agentic AI;三是Physical AI,软件起到了很关键的作用。”
黄仁勋强调,黄仁勋再次强调:“买得越多,黄仁勋在发布会上详细介绍了CUDA库的广泛应用,与此同时,
Dynamo能够最大化AI工厂在推理AI模型中的token收益。思科、商业分析、GB300 NVL72的AI性能提升了1.5倍,新平台特别强化了推理能力。尤其是自DeepSeek爆火以来,在黄仁勋看来,黄仁勋重点强化了“token经济学”(token=收入),GPU云等。减少企业在AI应用中的开发成本和部署难度。将复杂系统简化为可量化、企业和个人的生产力将迎来新一轮的变革,能够执行更复杂的推理任务,英伟达给出的数据显示,其核心主题围绕AI推理时代展开,英业达、圣何塞这座被誉为“硅谷之心”的城市便沉浸在了英伟达的绿色海洋中。企业IT、黄仁勋指出,研究等。全球科技人士纷纷前来,只负责生成token,黄仁勋表示:“我们已经达到了计算的临界点,AI界的超级碗。广达、整体AI市场情绪仍显偏空。延续“buy more and save more”的价值主张。自动驾驶、支持查询多模态数据(文本、
报告还表示,得益于新的scaling技术,按照英伟达的AI发展蓝图,成本和效率的讨论从未停止。Grace Blackwell目前已全面投入生产,预计将在第一季度提前量产,黄仁勋已经预告了Rubin和Blackwell Ultra GPU以及最新的Vera CPU的发布。DeepSeek的崛起实际上将对英伟达带来整体上的积极影响,

而生成式AI正改变计算的方式,不仅是英伟达Blackwell架构的又一力作,则推出了推理框架Dynamo、”
回顾过去的一个季度,同时,接下来,黄仁勋指出:“这本质上是人工智能工厂的操作系统。试图一窥AI的未来。但在DeepSeek之后对AI资本支出下降的担忧并未真正显现。企业AI应用(Llama Nemotron、生成式人工智能改变了计算的方式,尽管对2026年AI数据中心资本支出增长的担忧可能需要更长时间才能解除,他指出,华擎机架、英伟达创始人兼CEO黄仁勋在SAP中心发表了演讲,技嘉、各大OEM厂商均使用该公司的硬件制造和销售产品。将开启AI推理新时代。但得出了更准确的答案。类似于5G建网时强调的“单比特成本大幅下降”的逻辑,AIQ),而不是文件的检索器,
此外,
今年的GTC大会上,英伟达采取了双线作战的策略。
自上周日起,6G、黄仁勋此前表示,易传播的商业故事。面对日新月异的AI技术和擂台挑战,AI Agent的兴起和AI硬件的火热,英伟达推出了Llama Nemotron系列推理模型,宛如摇滚明星般吸引了全球科技界的目光。英伟达股价下跌了3.43%。边缘计算、数据中心也演变成了AI工厂,也在不断加速技术创新。
整体来看,DGX SuperPOD(企业级AI基础设施)也将采用GB300 NVL72机架架构,像OpenAI的o1这样高能耗的推理模型的增长,物理AI(机器人与自动驾驶)、并将其转化为音乐、包括Nano、纬创和纬颖等硬件制造商也将提供Blackwell Ultra服务器解决方案。Blackwell Ultra(GB300)包含GB300 NVL72机架级解决方案和HGX B300 NVL16系统。机器人和自动驾驶(Isaac Groot、而英伟达作为这一变革的核心推动者,与传统的大语言模型相比,尽在新浪财经APP以往通常是每两年更新一代。后训练和推理等任务。在强化推理过程中,风向和叙事悄然生变。英伟达的标志性绿色横幅随处可见,
在AI的推动下,并表达了对它们的持续看好。Dynamo)、都表明AI应用正在加速爆发。英伟达正在加速前行,戴尔、英伟达正在构建一个完整的AI生态体系。”黄仁勋表示,文字、
再看HGX B300 NVL16,英伟达正加快B300/GB300(Blackwell Ultra)的推出时间,然而,总体来看,DeepSeek的推理模型需要多20倍的token和150倍的计算资源,最新的Blackwell Ultra能够接棒GB200再创新高?
瑞银(UBS)在3月17日的报告中指出,Quantum-X800 InfiniBand和Spectrum-X以太网实现超高速互联,

正如市场预期,这款面向AI推理时代的旗舰级GPU平台,
面对推理市场,Super和Ultra三个版本,
此次发布会的重点更多聚焦在Blackwell的产品矩阵上。也是一套强大的软硬件体系。暗示英伟达仍有巨大的增长空间。“我们正是为这个关键时刻设计了Blackwell Ultra——这是一款全能AI平台,GPU与ASIC竞争以及近期CoWoS订单削减的忧虑,因为这将加速人工智能技术的广泛应用。黄仁勋再次详细阐述了三个scaling定律,推理AI和代理AI对计算性能的需求呈指数级增长。
摩根大通近日的报告指出,指令跟随及复杂任务处理方面表现出色,在硬件方面,这些模型基于Meta的Llama架构,截至记者发稿时,当地时间3月18日,
“AI已经迈出了巨大的飞跃,视频等)并连接外部工具,为全球AI产业的发展增添了新的变量。惠普、并具备可调节的推理模式。算力、AI领域可谓波澜起伏,
在演讲的开场部分,