OpenAI推gpt-image-1.5：对标谷歌，提升图像生成编辑能力还降成本-行业峰会-数据世界

OpenAI近日正式发布了新一代图像生成模型gpt-image-1.5，此举被视为对Google Gemini体系下热门产品Nano Banana系列的直接回应。新模型不仅面向开发者开放，还全面接管了ChatGPT的图像生成功能，旨在巩固其在AI图像生成领域的领先地位。这一升级标志着OpenAI在图像生成技术领域的又一次重要突破。

今年早些时候，OpenAI曾为ChatGPT的图像生成功能带来重大升级，新模型上线后迅速获得用户青睐，一周内生成图片数量突破7亿张。随后在4月，OpenAI通过推出gpt-image-1接口，将这项技术开放给开发者，使其能够在各种应用和服务中集成图像生成能力，进一步扩大了技术影响力。

与此同时，Google在9月推出的Gemini Nano Banana模型凭借其卓越的图像生成和编辑性能，迅速成为市场焦点。该模型在画面质量和编辑灵活性方面表现突出，被认为全面超越了OpenAI的gpt-image-1，并获得了全球开发者的广泛认可。上个月，Google又推出了Gemini 3 Pro Image（代号Nano Banana Pro），进一步提升了生成图像的准确性和一致性，巩固了其在图像生成领域的优势。

面对Google的强劲挑战，OpenAI推出的gpt-image-1.5被寄予厚望。新模型在图像编辑的精细度、品牌Logo和人脸等关键元素的保真度方面均有显著提升，同时能够更精准地理解和执行用户指令。特别是在处理图像中的文字时，新模型在密集文本和小字号文本的清晰度与正确性上表现尤为出色，满足了用户对高质量图像生成的更高需求。

对于开发者而言，gpt-image-1.5的另一大亮点是成本优化。与上一代模型相比，新模型在图像输入与输出的计费上降低了约20%，同时开发者仍可通过quality参数灵活控制生成成本。OpenAI表示，即使在较低质量设置下，新模型仍能保持强大的生成效果，为开发者提供了更具性价比的选择。

对于普通用户来说，gpt-image-1.5已经成为ChatGPT内置图像生成体验的核心引擎。新模型能够在保持光线、构图和人物特征等细节基本不变的前提下，实现精准编辑，性能提升最多可达4倍，生成与编辑响应速度更快，为用户带来了更加流畅和高效的图像生成体验。

AI新星罗福莉亮相小米大会详解MiMo-V2-Flash大模型三大特性与优势

在演讲中，罗福莉详细介绍了此次开源上线的小米MiMo-V2-Flash，着重阐述了其三大显著特性。此外，MiMo-V2-Flash还具备极致推理效率，在全球顶尖模型的速度和成本象限中，它凭借低成本、高速度的…

2025-12-17

荣耀WIN系列来袭：骁龙8系强芯搭配万mAh电池 12月26日发布

根据爆料信息，荣耀WIN搭载高通骁龙第五代骁龙8至尊版移动平台，其CPU采用2+6核心架构，性能核心频率高达4.6GHz，性能释放达到当前顶级水准。两款手机均内置一块10000mAh超大电池，并且都支持10…

2025-12-17

LifeSmart智能家居深度评测：稳定性、颜值与性价比的完美融合

如果是初次接触智能家居产品，可以选择一些基础的套餐，如智能照明系统、智能开关系统等；如果对智能家居有较高的要求，可以选择全屋智能解决方案，实现家居的全面智能化。其自主研发的CoTP™ 有线通讯协议为产品的稳…

2025-12-17

即梦AI网页版全面升级，打造一站式“AI片场”助力创意实现

2025-12-17

lululemon CEO换人：战略转向在即，能否破局重振辉煌？

2025-12-17