阿里通义千问推出多模态模型Qwen VLo,引入全新生成机制

来自: 和讯财经 收藏 邀请

凤凰网科技讯 6月28日,阿里云通义千问刚刚发文,宣布推出最新的多模态统一理解与生成模型Qwen VLo。这一全新升级的模型可以进行高质量的再创造,实现从感知到生成的跨越。

官方表示,Qwen VLo采用动态分辨率训练,支持动态分辨率生成。无论是输入端还是输出端,模型都支持任意分辨率和长宽比的图像生成。这意味着用户不再受限于固定的格式,可以根据实际需求生成适配不同场景的图像内容。

此外,Qwen VLo还创新性地引入了一种全新的生成机制:从上到下、从左到右逐步清晰的生成过程。这一机制不仅提升了生成效率,还特别适用于需要精细控制的长段落文字生成任务。

阿里云官方提醒,Qwen VLo属于预览阶段,还有很多不足的地方,在生成的过程可能存在不符合事实、不完全和原图一致的问题,开发团队还在持续迭代。

(责任编辑:郭健东 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com


鲜花

握手

雷人

路过

鸡蛋
上一篇:
理想成立“智能汽车群组”马东辉领衔,李想转攻AI发布时间:2025-06-27
下一篇:
相关推荐
实时动态
焦点话题
热门排行

在线客服(服务时间 9:00~18:00)

在线QQ客服
公司地址:广州市黄埔区康富路32号101房
客服电话:13326565461
电子邮箱:30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )