随着DALL-E的问世,互联网迎来了一个集体感觉良好的时刻。这个基于人工智能的图像生成器的灵感来自于艺术家萨尔瓦多-DALL-E和动画电影中可爱的机器人瓦力,它使用自然语言来生成你心中想要的任何神秘而美丽的图像。看到打出的输入信息,如"拿着冰激凌甜筒的微笑地鼠",机器的灵感瞬间涌现出来,这种生动的人工智能生成的图像显然得到了世界的共鸣。
DALL-E2使用了一种叫做扩散模型的概念,它试图将整个文本编码为一个描述来生成一个图像。然而,一旦文本有了更多的细节,单一的描述就很难捕捉到它的全部。此外,虽然它们高度灵活,但扩散模型有时很难理解某些概念的构成,例如混淆不同对象之间的属性或关系。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】