谷歌发布图像生成模型Gemini 2.5 Flash Image:多方面优于GPT-4o

来自: 和讯财经 收藏 邀请

凤凰网科技讯 8月27日,科技媒体The Decoder昨日(8月26日)发布博文,报道称谷歌DeepMind正式推出其最先进的图像生成与编辑模型Gemini 2.5 Flash Image,在Gemini应用中可根据文字指令,在保持人物与动物的外观一致的情况下,提高修改图片的精度。

据介绍,与此前的原生图像生成工具相比,它在根据文字进行图像修改时的准确率更高,谷歌表示,Gemini 2.5 Flash Image在多项任务中优于ChatGPT所用的GPT-4o,特别是在编辑图像时,它可以根据文字提示进行编辑。

该模型还支持通过文本提示进行精确的局部编辑。用户可以通过模糊背景、去除瑕疵、添加颜色或擦除整个物体,无需进行手动选择。同时该模型支持一次融合最多三张图像。

目前用户可通过Gemini App、API等方式访问,其API定价为每百万输出token30美元,单张图像成本约0.039美元。

(责任编辑:王治强 HF013)

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com


鲜花

握手

雷人

路过

鸡蛋
相关推荐
实时动态
焦点话题
热门排行

在线客服(服务时间 9:00~18:00)

在线QQ客服
公司地址:广州市黄埔区康富路32号101房
客服电话:13326565461
电子邮箱:30376048757@qq.com

Powered by 广州丁冬科技有限公司 © 2025 aiwsw.com Inc.( 粤ICP备2024347580号-3 )