数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

OpenAI推gpt-image-1.5:对标谷歌,提升图像生成编辑能力还降成本

2025-12-17来源:快讯编辑:瑞雪

OpenAI近日正式发布了新一代图像生成模型gpt-image-1.5,此举被视为对Google Gemini体系下热门产品Nano Banana系列的直接回应。新模型不仅面向开发者开放,还全面接管了ChatGPT的图像生成功能,旨在巩固其在AI图像生成领域的领先地位。这一升级标志着OpenAI在图像生成技术领域的又一次重要突破。

今年早些时候,OpenAI曾为ChatGPT的图像生成功能带来重大升级,新模型上线后迅速获得用户青睐,一周内生成图片数量突破7亿张。随后在4月,OpenAI通过推出gpt-image-1接口,将这项技术开放给开发者,使其能够在各种应用和服务中集成图像生成能力,进一步扩大了技术影响力。

与此同时,Google在9月推出的Gemini Nano Banana模型凭借其卓越的图像生成和编辑性能,迅速成为市场焦点。该模型在画面质量和编辑灵活性方面表现突出,被认为全面超越了OpenAI的gpt-image-1,并获得了全球开发者的广泛认可。上个月,Google又推出了Gemini 3 Pro Image(代号Nano Banana Pro),进一步提升了生成图像的准确性和一致性,巩固了其在图像生成领域的优势。

面对Google的强劲挑战,OpenAI推出的gpt-image-1.5被寄予厚望。新模型在图像编辑的精细度、品牌Logo和人脸等关键元素的保真度方面均有显著提升,同时能够更精准地理解和执行用户指令。特别是在处理图像中的文字时,新模型在密集文本和小字号文本的清晰度与正确性上表现尤为出色,满足了用户对高质量图像生成的更高需求。

对于开发者而言,gpt-image-1.5的另一大亮点是成本优化。与上一代模型相比,新模型在图像输入与输出的计费上降低了约20%,同时开发者仍可通过quality参数灵活控制生成成本。OpenAI表示,即使在较低质量设置下,新模型仍能保持强大的生成效果,为开发者提供了更具性价比的选择。

对于普通用户来说,gpt-image-1.5已经成为ChatGPT内置图像生成体验的核心引擎。新模型能够在保持光线、构图和人物特征等细节基本不变的前提下,实现精准编辑,性能提升最多可达4倍,生成与编辑响应速度更快,为用户带来了更加流畅和高效的图像生成体验。

AI新星罗福莉亮相小米大会 详解MiMo-V2-Flash大模型三大特性与优势
在演讲中,罗福莉详细介绍了此次开源上线的小米MiMo-V2-Flash,着重阐述了其三大显著特性。 此外,MiMo-V2-Flash还具备极致推理效率,在全球顶尖模型的速度和成本象限中,它凭借低成本、高速度的…

2025-12-17

荣耀WIN系列来袭:骁龙8系强芯搭配万mAh电池 12月26日发布
根据爆料信息,荣耀WIN搭载高通骁龙第五代骁龙8至尊版移动平台,其CPU采用2+6核心架构,性能核心频率高达4.6GHz,性能释放达到当前顶级水准。两款手机均内置一块10000mAh超大电池,并且都支持10…

2025-12-17

LifeSmart智能家居深度评测:稳定性、颜值与性价比的完美融合
如果是初次接触智能家居产品,可以选择一些基础的套餐,如智能照明系统、智能开关系统等;如果对智能家居有较高的要求,可以选择全屋智能解决方案,实现家居的全面智能化。其自主研发的CoTP™ 有线通讯协议为产品的稳…

2025-12-17