给张图就能反推Prompt AI绘画神器Midjourney能够“看图说话”了-品论天涯网

在各种AIGC产品层出不穷的今天，让AI画一张图已经不是什么难事。尽管有着“无需动笔”、“零门槛作画”等一系列优点，但很多人并不能借助AI之手轻松获得一幅理想中的作品——难点在于“prompt”。3Hy品论天涯网

Prompt方法是一门极深的管理学问：如果不输入精准的命令描述，生成结果就可能十分随机，甚至与预期相去甚远。但归根结底，如何给出完美的prompt，如何让模型按照人类用户预设的方式输出结果，甚至如何降低花在prompt上的成本，很少有人清楚。3Hy品论天涯网

正因此，AIGC产业衍生出了一种专门的职业——prompt工程师。前段时间，初创公司Anthropic在旧金山招聘“prompt工程师和图书馆员”，给出的薪水高达33.5万美元。3Hy品论天涯网

或许，这一过程也能让AI代劳呢？AI会做的比人类更好吗？3Hy品论天涯网

最近，AI绘画神器Midjourney就上新了一个功能：/describe。3Hy品论天涯网

3Hy品论天涯网

“今天，我们发布了一个/describe命令，可让您将图像转换为文字。”3Hy品论天涯网

具体来说，Midjourney学会了从图像中反推prompt。如果你在Midjourney上传一张图片，它会提供给四个版本的描述，你可以直接拿来并进行调整，然后去生成自己想要的图片变体。3Hy品论天涯网

Midjourney是一款2022年3月发布的AI绘画工具，此前刚刚推出第五代版本，由于生成效果十分“炸裂，大量用户迅速涌入，以至于该公司不得不关闭了免费注册通道。3Hy品论天涯网

这一次功能的更新意义重大：3Hy品论天涯网

改进可访问性：通过用于Web显示的ALT文本元素，图像描述让有视觉障碍或阅读困难的人更容易访问数字内容；3Hy品论天涯网

增强的可搜索性：描述可以通过搜索引擎启用更好的搜索功能和索引；3Hy品论天涯网

用于标题：可以包含描述，使图像更加清晰；3Hy品论天涯网

详细prompt：描述可用于创建更详细的prompt以制作新变体，可以为快速工程提供灵感。3Hy品论天涯网

怎么使用？3Hy品论天涯网

用户只需从写一个「/describe”开始，Midjourney提供了上传图像的位置：3Hy品论天涯网

3Hy品论天涯网

上传图片后，点击进入：3Hy品论天涯网

3Hy品论天涯网

然后，Midjourney根据图像返回四个描述：3Hy品论天涯网

3Hy品论天涯网

底部的四个数字是混合按钮，每个数字都与相应的描述相匹配。单击数字，Midjourney会根据新的描述重新混合图像。3Hy品论天涯网

你也可以混合修改prompt：3Hy品论天涯网

3Hy品论天涯网

这是创建示例图像的原始prompt：3Hy品论天涯网

anillustrationofabrainwithtreeroots,psychedelicart,vibrant,byAlexGrey,byAmandaSage,byRobertVenosa,neoncolors（一幅有树根的大脑图像，迷幻艺术，充满活力，作者AlexGrey，作者AmandaSage，作者RobertVenosa，霓虹颜色）3Hy品论天涯网

这是Midjourney描述的prompt之一，被用于混合：3Hy品论天涯网

Animageofanabstractbraintreewithroots,inthestyleofmarkhenson,luminouscolors,darksymbolism,detailedanatomy,boldlines,vibrantcolor,psychologicalphenomenaillustrations,chiaroscurowoodcuts（一幅有树根的抽象大脑树图像，马克・亨森的风格，明亮的色彩，黑暗的象征主义，详细的解剖学，大胆的线条，鲜艳的色彩，心理现象的插图，千鸟格的木刻）3Hy品论天涯网

新的生成结果如下：3Hy品论天涯网

3Hy品论天涯网

试用体验3Hy品论天涯网

该功能一经发布，就吸引了各位AI绘画爱好者的注意，很多人立马就上手开始创作了。3Hy品论天涯网

以下是通过一张NASA登月任务宇航员照片生成的新图片（右），的确以假乱真：3Hy品论天涯网

3Hy品论天涯网

下图（左）为原图，（右）为/describe之后生成的新结果：3Hy品论天涯网

3Hy品论天涯网

还有人想到，可以用/describe来进行品牌logo的升级。如此一来，既可以延续此前的品牌辨识度，又带来了全新的形象。3Hy品论天涯网

3Hy品论天涯网

星巴克的“新logo”毫无违和感。3Hy品论天涯网

苹果公司的经典标志，也可以是五彩缤纷的：3Hy品论天涯网

3Hy品论天涯网

这是阿迪达斯：3Hy品论天涯网

3Hy品论天涯网

百事公司可以考虑以下这款新设计：3Hy品论天涯网

3Hy品论天涯网

不管是“文生图”还是“图生文”，随着用户交互的增加，MidJourney的效果必然会有所提升。有研究者猜测，MidJourney一直在进行大规模的人类反馈强化学习（RLHF），而这可能是有史以来规模最大的文字转图像。拥有的用户越多，MidJourney能做的RLHF就越好，然后获得的用户会变得更多。3Hy品论天涯网