英伟达,重大发布!

来自: 收藏 邀请

每经编辑|毕陆名    

全球人工智能算力芯片龙头英伟达(NVDA,股价:170.760美元;总市值:4.15万亿美元)周二宣布,推出专为长上下文工作负载设计的专用GPU Rubin CPX,用于翻倍提升当前AI推理运算的工作效率,特别是编程、视频生成等需要超长上下文窗口的应用。

NVIDIA Vera Rubin NVL144 CPX机架与托盘,来源:公司博客

英伟达CEO黄仁勋表示,CPX是首款专为需要一次性处理大量知识(数百万级别tokens),并进行人工智能推理的模型而构建的芯片。

需要说明的是,Rubin就是英伟达将在明年发售的下一代顶级算力芯片,所以基于Rubin的CPX预计也要到2026年底出货。下一代英伟达旗舰AI服务器的全称叫做NVIDIA Vera Rubin NVL144 CPX——集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。

英伟达透露,搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能,能比当前旗舰机架GB300 NVL72高出最多6.5倍。

据悉,下一代旗舰机架将提供8exaFLOPs的NVFP4算力,比GB300 NVL72高出7.5倍。同时单个机架就能提供100TB的高速内存和1.7PB/s的内存带宽。

作为行业首创之举,英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。

英伟达介绍称,推理过程包括两个截然不同的阶段:上下文阶段与生成阶段,两者对基础设施的要求本质上完全不同。

据悉,Rubin CPX专门针对“数百万tokens”级别的长上下文性能进行优化,具备30petaFLOPs的NVFP4算力、128GB GDDR7内存。

英伟达估计,大约有20%的AI应用会“坐等”首个token出现。例如解码10万行代码可能需要5-10分钟。而多帧、多秒的视频,预处理和逐帧嵌入会迅速增加延迟,这也是为什么当前的视频大模型通常仅用于制作短片。

英伟达计划以两种形式提供Rubin CPX,一种是与Vera Rubin装在同一个托盘上。对于已经下单NVL144的用户,英伟达也会单独出售一整个机架的CPX芯片,数量正好匹配Rubin机架。

美国东部时间8月27日美股盘后,英伟达发布2026财年第二季度财报。第二季度,英伟达收入达到467亿美元,超过此前市场预期的461亿美元,比去年同期增长55%;净利润(按美国标准会计准则GAAP衡量)为264亿美元,同比增长60%,换算成每股收益(EPS)为1.04美元,也超出了市场预期的1.01美元。

毛利率则有所下滑,该季度为72.4%,去年同期为75.2%。对下一季度的业绩展望,英伟达预计第三季度收入将达到540亿美元,毛利率预计在73.3%至73.5%之间。截至收盘,英伟达涨0.77%,公司最新市值4.09万亿美元。

4日,博通盘后公布的第三财季业绩超出预期,并为第四财季提供了强劲的指引。公司预计,第四财季的人工智能芯片业务继续提速。

在财报电话会上,博通首席执行官陈福阳(Hock Tan)表示,公司已从一家神秘的新客户那里获得了100亿美元的定制芯片订单,这一消息令投资者们感到惊喜。

电话会后不久,业内人士透露,这名新客户极大可能就是人工智能领军企业OpenAI——消息称,OpenAI与博通共同设计的芯片将在明年首次上市,以减少对英伟达产品的依赖。

这意味着,博通将更直接地与人工智能(AI)硬件龙头英伟达竞争。

Clearstead Advisors高管Jim Awad表示,投资者需要准备好面对英伟达在该领域出现更多竞争的局面,但由于AI市场本身的快速扩张,即便失去部分市场份额,公司依然能保持稳定增长。

“我认为这(英伟达股价下跌)只是膝跳反应,不是卖出的理由,”Awad说道,“关键要看博通和OpenAI接下来的执行情况,目前没人能在一夜之间夺走英伟达的生意。”

每日经济新闻综合英伟达、公开信


封面图片来源:视觉中国


鲜花

握手

雷人

路过

鸡蛋
相关推荐
实时动态
焦点话题
热门排行

在线客服(服务时间 9:00~18:00)

在线QQ客服
公司地址:广州市黄埔区康富路32号101房
客服电话:13326565461
电子邮箱:30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )