英伟达，重大发布！

来自: 收藏邀请

每经编辑｜毕陆名

全球人工智能算力芯片龙头英伟达（NVDA，股价：170.760美元；总市值：4.15万亿美元）周二宣布，推出专为长上下文工作负载设计的专用GPU Rubin CPX，用于翻倍提升当前AI推理运算的工作效率，特别是编程、视频生成等需要超长上下文窗口的应用。

NVIDIA Vera Rubin NVL144 CPX机架与托盘，来源：公司博客

英伟达CEO黄仁勋表示，CPX是首款专为需要一次性处理大量知识（数百万级别tokens），并进行人工智能推理的模型而构建的芯片。

需要说明的是，Rubin就是英伟达将在明年发售的下一代顶级算力芯片，所以基于Rubin的CPX预计也要到2026年底出货。下一代英伟达旗舰AI服务器的全称叫做NVIDIA Vera Rubin NVL144 CPX——集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。

英伟达透露，搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能，能比当前旗舰机架GB300 NVL72高出最多6.5倍。

据悉，下一代旗舰机架将提供8exaFLOPs的NVFP4算力，比GB300 NVL72高出7.5倍。同时单个机架就能提供100TB的高速内存和1.7PB/s的内存带宽。

作为行业首创之举，英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。

英伟达介绍称，推理过程包括两个截然不同的阶段：上下文阶段与生成阶段，两者对基础设施的要求本质上完全不同。

据悉，Rubin CPX专门针对“数百万tokens”级别的长上下文性能进行优化，具备30petaFLOPs的NVFP4算力、128GB GDDR7内存。

英伟达估计，大约有20%的AI应用会“坐等”首个token出现。例如解码10万行代码可能需要5-10分钟。而多帧、多秒的视频，预处理和逐帧嵌入会迅速增加延迟，这也是为什么当前的视频大模型通常仅用于制作短片。

英伟达计划以两种形式提供Rubin CPX，一种是与Vera Rubin装在同一个托盘上。对于已经下单NVL144的用户，英伟达也会单独出售一整个机架的CPX芯片，数量正好匹配Rubin机架。

美国东部时间8月27日美股盘后，英伟达发布2026财年第二季度财报。第二季度，英伟达收入达到467亿美元，超过此前市场预期的461亿美元，比去年同期增长55%；净利润（按美国标准会计准则GAAP衡量）为264亿美元，同比增长60%，换算成每股收益（EPS）为1.04美元，也超出了市场预期的1.01美元。

毛利率则有所下滑，该季度为72.4%，去年同期为75.2%。对下一季度的业绩展望，英伟达预计第三季度收入将达到540亿美元，毛利率预计在73.3%至73.5%之间。截至收盘，英伟达涨0.77%，公司最新市值4.09万亿美元。

4日，博通盘后公布的第三财季业绩超出预期，并为第四财季提供了强劲的指引。公司预计，第四财季的人工智能芯片业务继续提速。

在财报电话会上，博通首席执行官陈福阳（Hock Tan）表示，公司已从一家神秘的新客户那里获得了100亿美元的定制芯片订单，这一消息令投资者们感到惊喜。

电话会后不久，业内人士透露，这名新客户极大可能就是人工智能领军企业OpenAI——消息称，OpenAI与博通共同设计的芯片将在明年首次上市，以减少对英伟达产品的依赖。

这意味着，博通将更直接地与人工智能（AI）硬件龙头英伟达竞争。

Clearstead Advisors高管Jim Awad表示，投资者需要准备好面对英伟达在该领域出现更多竞争的局面，但由于AI市场本身的快速扩张，即便失去部分市场份额，公司依然能保持稳定增长。

“我认为这（英伟达股价下跌）只是膝跳反应，不是卖出的理由，”Awad说道，“关键要看博通和OpenAI接下来的执行情况，目前没人能在一夜之间夺走英伟达的生意。”

每日经济新闻综合英伟达、公开信息

封面图片来源：视觉中国