中国经济网北京6月23日讯(记者 王惠绵)近日,华为常务董事、华为云计算CEO张平安在华为开发者大会上表示,盘古大模型5.5正式发布,自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型全面升级。同时,基于CloudMatrix 384超节点的新一代N腾AI云服务全面上线,为大模型应用提供澎湃算力。 在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、500多个场景中落地,在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值。本次大会上,华为云重磅发布盘古大模型5.5,五大基础模型全面升级,为行业提供全新价值。 盘古自然语言处理NLP大模型:全新的718B 深度思考模型是一个由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域大幅增强,实现能力领先。盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级,提升用户体验。例如,盘古提出了自适应快慢思考合一的技术,通过构建难度感知的快慢思考数据和两阶段渐进训练,实现模型根据问题难易程度自适应地切换快慢思考,简单问题敏捷回复,复杂问题深度思考,整体模型推理效率提升8倍。 盘古预测大模型:采用业界首创的triplet transformer统一预训练架构,将不同行业的数据,包括工艺参数的表格数据,设备运行日志的时间序列数据,产品检测的图片数据进行统一的三元组编码,并在同一框架内高效处理和预训练,极大地提升预测大模型的精度,并大幅提升跨行业、跨场景的泛化性。 盘古科学计算大模型:华为云持续拓展盘古科学计算大模型与更多科学应用领域的结合。深圳气象局基于盘古,进一步升级了“智霁”大模型,首次实现AI集合预报,能更直观地反映天气系统的演变可能性,减少单一预报模型的误差。重庆市气象局针对成渝地区降水局地性强,且降水强度大的特点,基于盘古打造了“天资・12h“气象大模型,提升灾害天气的日内预报预警能力。深圳能源采用盘古进行中短期风光水发电量预测,减少发电侧弃电,提升能源开发效率。 盘古计算机视觉CV大模型:华为云发布全新MoE架构的300亿参数视觉大模型,这是目前业界最大的视觉模型,并全面支持图像、红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策。另外,盘古CV大模型通过跨维度生成模型,构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库,极大地提升了业务场景的可识别种类与精度。 盘古多模态大模型:全新发布基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练,构建所需要的数字物理空间,实现持续优化迭代。例如,在智能驾驶领域,输入首帧的行车场景、行车控制信息和路网数据,盘古世界模型就可以生成每路摄像头的行车视频和激光雷达的点云,能够为智能驾驶生成大量的训练数据,而无需依赖高成本的路采。 此外,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。华为云新一代N腾AI云服务基于CloudMatrix 384超节点,首创将384颗N腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s,与非超节点相比提升近4倍。超节点架构能更好地支持混合多专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率;同时,超节点还可以支持“一卡一算子任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。 对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将432个超节点级联成最高16万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如“日推夜训”,训推算力可灵活分配,帮助客户资源使用最优。当前,N腾AI云服务已经成为AI基础设施的最优选择,为科大讯飞、丁冬、硅基流动、面壁智能、中科院、360等超过1300家客户提供澎湃的AI算力,加速千行万业智能化升级。 (责任编辑:佟明彪) (责任编辑:张晓波 )
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com |