在各种AIGC产品层出不穷的今天,让AI画一张图已经不是什么难事。尽管有着“无需动笔”、“零门槛作画”等一系列优点,但很多人并不能借助AI之手轻松获得一幅理想中的作品——难点在于“prompt”。
Prompt方法是一门极深的管理学问:如果不输入精准的命令描述,生成结果就可能十分随机,甚至与预期相去甚远。但归根结底,如何给出完美的prompt,如何让模型按照人类用户预设的方式输出结果,甚至如何降低花在prompt上的成本,很少有人清楚。
正因此,AIGC产业衍生出了一种专门的职业——prompt工程师。前段时间,初创公司Anthropic在旧金山招聘“prompt工程师和图书馆员”,给出的薪水高达33.5万美元。
或许,这一过程也能让AI代劳呢?AI会做的比人类更好吗?
最近,AI绘画神器Midjourney就上新了一个功能:/describe。
“今天,我们发布了一个/describe命令,可让您将图像转换为文字。”
具体来说,Midjourney学会了从图像中反推prompt。如果你在Midjourney上传一张图片,它会提供给四个版本的描述,你可以直接拿来并进行调整,然后去生成自己想要的图片变体。
Midjourney是一款2022年3月发布的AI绘画工具,此前刚刚推出第五代版本,由于生成效果十分“炸裂,大量用户迅速涌入,以至于该公司不得不关闭了免费注册通道。
这一次功能的更新意义重大:
改进可访问性:通过用于Web显示的ALT文本元素,图像描述让有视觉障碍或阅读困难的人更容易访问数字内容;
增强的可搜索性:描述可以通过搜索引擎启用更好的搜索功能和索引;
用于标题:可以包含描述,使图像更加清晰;
详细prompt:描述可用于创建更详细的prompt以制作新变体,可以为快速工程提供灵感。
怎么使用?
用户只需从写一个「/describe”开始,Midjourney提供了上传图像的位置:
上传图片后,点击进入:
然后,Midjourney根据图像返回四个描述:
底部的四个数字是混合按钮,每个数字都与相应的描述相匹配。单击数字,Midjourney会根据新的描述重新混合图像。
你也可以混合修改prompt:
这是创建示例图像的原始prompt:
anillustrationofabrainwithtreeroots,psychedelicart,vibrant,byAlexGrey,byAmandaSage,byRobertVenosa,neoncolors(一幅有树根的大脑图像,迷幻艺术,充满活力,作者AlexGrey,作者AmandaSage,作者RobertVenosa,霓虹颜色)
这是Midjourney描述的prompt之一,被用于混合:
Animageofanabstractbraintreewithroots,inthestyleofmarkhenson,luminouscolors,darksymbolism,detailedanatomy,boldlines,vibrantcolor,psychologicalphenomenaillustrations,chiaroscurowoodcuts(一幅有树根的抽象大脑树图像,马克・亨森的风格,明亮的色彩,黑暗的象征主义,详细的解剖学,大胆的线条,鲜艳的色彩,心理现象的插图,千鸟格的木刻)
新的生成结果如下:
试用体验
该功能一经发布,就吸引了各位AI绘画爱好者的注意,很多人立马就上手开始创作了。
以下是通过一张NASA登月任务宇航员照片生成的新图片(右),的确以假乱真:
下图(左)为原图,(右)为/describe之后生成的新结果:
还有人想到,可以用/describe来进行品牌logo的升级。如此一来,既可以延续此前的品牌辨识度,又带来了全新的形象。
星巴克的“新logo”毫无违和感。
苹果公司的经典标志,也可以是五彩缤纷的:
这是阿迪达斯:
百事公司可以考虑以下这款新设计:
不管是“文生图”还是“图生文”,随着用户交互的增加,MidJourney的效果必然会有所提升。有研究者猜测,MidJourney一直在进行大规模的人类反馈强化学习(RLHF),而这可能是有史以来规模最大的文字转图像。拥有的用户越多,MidJourney能做的RLHF就越好,然后获得的用户会变得更多。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】