OpenAI正在更广泛地推出其最新的文本到图像生成器。本周四,该公司将向ChatGPTPlus和企业客户提供可在ChatGPT应用程序中使用的新DALL-E3模型。OpenAI表示,它已经为该模型准备好了安全缓解堆栈,使其可以扩大发布范围。
DALL-E3于上个月首次发布,OpenAI展示了它是如何改进之前的DALL-E2的,允许用户利用ChatGPT编写更长、更具视觉描述性的提示语,供图像生成器使用。DALL-E3被添加到必应聊天和必应图像生成器中,使微软的平台成为第一个向公众提供更广泛模型访问的平台--甚至早于ChatGPT。
广告中宣传的减少有害图像的防护措施并不总是有效,用户在生成世贸中心图像时,出现海绵宝宝和其他角色驾驶飞机冲向大楼。即使微软曾经尝试屏蔽了某些提示,其他简单的变通方法也产生了类似的结果。
文本到图像生成器,如Midjourney、StableDiffusion和较早的DALL-E版本都曾引发过争议。该技术曾输出过版权图片资料、未经同意的裸体、改变主题的种族以及对公众人物的照相写实歪曲。
OpenAI承诺这次将采取更广泛的措施,并提供了一个网站来展示《DALL-E3》所做的研究。该公司表示,它将"限制模型生成在世艺术家风格内容和公众人物形象的可能性,并改善生成图像的人口统计代表性"。OpenAI还拥有一个内部"出处分类器"工具,该工具称其检测图像是否由《DALL-E3》生成的准确率高达99%。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】