Altman表示,GPT-4o原生图像生成现已在ChatGPT和OpenAI的AI视频生成产品Sora中上线,供该公司每月200美元的Pro计划订阅者使用。OpenAI表示,该功能将很快向ChatGPT的Plus和免费用户以及使用该公司API服务的开发人员推出。
具有图像输出功能的GPT-4o比它有效取代的图像生成模型DALL-E3的“思考”时间更长,从而可以生成OpenAI所描述的更准确、更详细的图像。GPT-4o可以编辑现有图像,包括其中有人的图像——对它们进行转换或“修复”细节,例如前景和背景对象。
OpenAI没有透露它使用了哪些图像数据来实现新的图像生成功能。许多生成式人工智能供应商将训练数据视为竞争优势,因此对其及其相关信息讳莫如深。但训练数据细节也可能引发与知识产权相关的诉讼,这也是公司不愿透露太多信息的另一个原因。
OpenAI提供了一份退出表格,允许创作者要求将其作品从其训练数据集中删除。该公司还表示,它尊重禁止其网络抓取机器人从网站收集训练数据(包括图像)的请求。
ChatGPT升级后的图像生成功能紧随Google为其旗舰型号之一Gemini2.0Flash进行实验性的原生图像输出。这一强大功能在社交媒体上迅速走红——但原因未必是好的。Gemini2.0Flash的图像组件几乎没有防护措施,允许人们去除水印并创建描绘受版权保护的人物的图像。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】