3月26日消息,昨夜凌晨,OpenAI 宣布ChatGPT中的原生图像生成功能正式推出,在 GPT-4o 模型中集成新一代图像生成器。
新功能支持精确渲染文本内容、理解复杂指令、结合上下文生成图像。同时,模型还支持对上传图片进行编辑或风格转换,用户只需通过文本指令即可完成调整。
该功能已向 Plus、Pro、Team 和免费用户开放,Enterprise 和 Edu 用户将很快获得访问权限,开发者可在数周后通过 API 使用。
OpenAI CEO Sam Altman 在 X 平台表示,初次看到生成的图片时“难以置信是 AI 所为”,期待用户能够发挥创意。
GPT-4o 采用自回归模型,与作为扩散模型的 DALL·E 不同。新模型能处理多达10-20个不同物体的复杂指令,远超其他模型的5-8个物体限制。(袁宁)
