人工智能

GPT-4o 生图实测:光影、文字、细节栩栩如生

字号+作者:赛博禅心 来源:赛博禅心 2025-03-26 09:52 评论(创建话题) 收藏成功收藏本文

ChatGPT凌晨发了新东西,通过4o模型,创建靠谱的图像:光影、文字、细节栩栩如生,通过对话,可以进一步修改:遮挡、倒影等等都处理的非常到位。图片质量相当高,可'...

ChatGPT凌晨发了新东西,通过4o模型,创建靠谱的图像:光影、文字、细节栩栩如生,通过对话,可以进一步修改:遮挡、倒影等等都处理的非常到位。ubq品论天涯网


ubq品论天涯网


ubq品论天涯网

图片质量相当高,可直接用于科普插画,比如:分光三棱镜ubq品论天涯网


ubq品论天涯网

继续对话,一致性相当好,比如让他画成书册:ubq品论天涯网


ubq品论天涯网

只能说:斗宗强者,竟恐怖如斯,OpenAI的箱子里,还是有东西的。ubq品论天涯网

让我们细致看一看:本次更新,突破了以往的哪些边界。ubq品论天涯网

文本渲染绝佳ubq品论天涯网

一图胜千言,来感受一下。比如让他根据对话内容,来画一个菜单(文字是单独给的)ubq品论天涯网


ubq品论天涯网

或者让他去画一个婚礼邀请(同样,文字单独给到)ubq品论天涯网


ubq品论天涯网

多轮生成很棒ubq品论天涯网

这套图像生成,是GPT-4o的原生功能,可通过对话,逐步进行图像完善,并保持内容一致。比如这个:ubq品论天涯网


ubq品论天涯网

也比如我把橘猫放在了魔兽世界里ubq品论天涯网


ubq品论天涯网

甚至来说,我还可以要求他生成png透明版ubq品论天涯网


ubq品论天涯网

指令遵循很强ubq品论天涯网

在生成图像的时候,4o的指令遵循能力很强,可以处理包含10-20个不同物体的场景,并对物体与特征及关系的紧密绑定允许更好的控制。ubq品论天涯网

比如:只有一滴红酒的空玻璃杯ubq品论天涯网


ubq品论天涯网

prompt:showmeawineglasswithonlythetiniestdropofredwineinit.ubq品论天涯网

比如:看不见的大象ubq品论天涯网


ubq品论天涯网

Prompt:Weneedevidencethereisacurrentlypresentinvisibleelephant.Considerwhatanelephantisanddoesintheenvironment,thenshowusthat,perhapsmid-process-buttheelephantitselfisnotshownatallubq品论天涯网

我还让他给画了个撸猫指南ubq品论天涯网


ubq品论天涯网

Prompt:4-stepphotoguideonhowtopetacatubq品论天涯网

上下文关联ubq品论天涯网

如果很清楚知道自己要什么,可以直接上传图片给ChatGPT,让参考风格、精准输出。比如给一些风格插画,然后要求GPT来生成一个三角形轮子的自行车ubq品论天涯网


ubq品论天涯网

吐槽:为啥是英国专利ubq品论天涯网

而我,作为炉石玩家,我让ChatGPT来生成一份奥特曼的专属卡片ubq品论天涯网


ubq品论天涯网

Hhhhh太真实了,GPT觉得奥特曼上不了传说,种族属于“战吼”(特别能逼逼)ubq品论天涯网

然后,还可以让他做个实体版...稀有度变成了普通,技能变成了嘲讽,hhhhh认真的吗?ubq品论天涯网


ubq品论天涯网

贯通现实知识ubq品论天涯网

4o的绘图,能够从大模型中直接获取到知识,生成与现实世界知识相符的图像,如:可以直接使用的鸡尾酒配方ubq品论天涯网


ubq品论天涯网

Prompt:Makemeaprofessionallyshotphotorealisticdiagramofthetopsellingcocktailsinmybarwithrecipeslabeledoneachdrink.puttherecipesonhandwrittencardsinfrontofeachdrink.Thecardsarebrown,andthetextisblack.Backgroundiswhite.Titleis"4mostpopularcocktails"ubq品论天涯网

制作一款披萨ubq品论天涯网


ubq品论天涯网

Prompt:AgraphicofanItalianchefgivinginstructionsonhowtomakeauthenticpepperonipizzaubq品论天涯网

动量定理和冲量定理ubq品论天涯网


ubq品论天涯网

Prompt:画一个有关冲量定理和动量定理的infographicubq品论天涯网


ubq品论天涯网

Prompt:画一个肯德基的简体中文菜单,其中有一个套餐叫做“V我50”ubq品论天涯网

风格多样ubq品论天涯网

4o的这个模型,能轻松绘制各种风格的图像。比如我让他用莫奈的风格,来画一只猫ubq品论天涯网


ubq品论天涯网

Prompt:一只猫,莫奈风格ubq品论天涯网

幻想风格的海豚地铁ubq品论天涯网


ubq品论天涯网

Prompt:Arealisticunderwaterscenewithdolphinsswimmingthroughthewindowsofanabandonedsubwaycar,withbubblesanddetailedwaterflowaccuratelysimulated.ubq品论天涯网

奥特曼在采棉花,颇有纪录片的范儿ubq品论天涯网


ubq品论天涯网

Prompt:山姆奥特曼正在采棉花ubq品论天涯网

一些限制ubq品论天涯网

当然,这个模型也存在一些问题:ubq品论天涯网

对于长图像,会出现剪裁问题ubq品论天涯网


ubq品论天涯网

可能产生幻觉,然后开始胡编乱造ubq品论天涯网


ubq品论天涯网

难以准确渲染超过20个不同概念ubq品论天涯网


ubq品论天涯网

多语言文本渲染:处理非拉丁语言(比如中文),不够准确ubq品论天涯网


ubq品论天涯网

对特定部分要求编辑,可能会出bugubq品论天涯网


ubq品论天涯网

密集文本下,效果会不好ubq品论天涯网


ubq品论天涯网

以及...出于安全考虑,很多内容不允许被生成,比如:米老鼠大战皮卡丘的钞票ubq品论天涯网


ubq品论天涯网

最后ubq品论天涯网

OpenAI这次的更新的确非常棒,真没得黑。ubq品论天涯网

这项功能已经通过ChatGPT&Sora向Plus、Pro、Team和免费用户推出,替换DaLLE作为默认图像生成器。,Enterprise和Edu用户也将很快更新,API也将在数周内进行更新。ubq品论天涯网

所以,不要小瞧OpenAI,箱子里有货的。ubq品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱service@pltyw.com

9
扫二维码添加收藏返回顶部