人工智能

最新AI生图模型Flux1.1刷屏 添加单反相机文件名获得超写实图像

字号+作者: 来源:量子位 2024-10-06 15:02 评论(创建话题) 收藏成功收藏本文

最新AI文生图模型Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。评论区网友的反应belike:我分不清,真'...

最新AI文生图模型Flux1.1,一夜刷屏。只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。评论区网友的反应belike:我分不清,真的分不清啊。X9d品论天涯网


X9d品论天涯网


X9d品论天涯网

这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。X9d品论天涯网

比如“CR2”就是佳能相机使用的原始图像文件格式,输入“IMG”+随机编号+“.CR2”,再加指定的内容,就能获得一张写实图像了。X9d品论天涯网


X9d品论天涯网

后面也陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,甚至苹果的“HEIC”格式,都能获得不错的结果。X9d品论天涯网


X9d品论天涯网

以至于有人都开始怀疑,不会是模型随机吐出来一张训练数据里的真照片吧?X9d品论天涯网


X9d品论天涯网

不过放大看一些特定细节,还是很容易看出确实是AI生成的,比如车牌号上的文字都是乱码。X9d品论天涯网


X9d品论天涯网

那么是否Flux1.1模型本身能力就很强大,这个技巧在其中起到了多大作用呢?X9d品论天涯网

一位资深修图师傅晒出了对比,左边加了IMG_1018.CR2,对比右边不加的,他认为差别巨大。X9d品论天涯网


X9d品论天涯网


X9d品论天涯网

我们的实测结果也能看出,加上这个技巧能显著提升画面真实性。X9d品论天涯网

现在想免费试玩这个Flux1.1模型,可以来到together.ai平台,注册即送5美元的积分。X9d品论天涯网


X9d品论天涯网

随便生成一张在长城的游客自拍照,乍一看像那么回事,但仔细观察人物皮肤质感、背景山和植物都有还是有一股AI味。X9d品论天涯网


X9d品论天涯网

换成“IMG_0314.cr2:selfieonTheGreatWall”,是不是立马就不一样了?X9d品论天涯网


X9d品论天涯网

代号蓝莓,最新SOTA文生图模型X9d品论天涯网

随着FLUX1.1的正式发布,此前在文生图模型排行榜上屡占榜首的两个无人认领的“蓝莓”模型的神秘面纱也被揭下,正是它。X9d品论天涯网


X9d品论天涯网

官方不藏了,直接放出数据,在ArtificialAnalysisimagearena上,FLUX1.1[pro]以“blueberry”为代号,超越所有其它模型,获得最高的整体Elo评分。X9d品论天涯网


X9d品论天涯网

相比之下,FLUX1.1[pro]价格也更低,速度更快,各项指标超越Midjourney、SD3、Ideogram等。X9d品论天涯网


X9d品论天涯网


X9d品论天涯网

生成速度上,FLUX1.1[pro]在保持图像质量、指令响应和多样性提升的同时,速度是前代FLUX.1[pro]的6倍。X9d品论天涯网

顺便提一下,现在FLUX.1[pro]也进行了更新,速度是之前的2倍,FLUX1.1[pro]的速度是目前可用的FLUX.1[pro]的3倍。X9d品论天涯网

此外,官方表示即将推出快速高分辨率生成,FLUX1.1[pro]可原生支持的那种,在不牺牲任何指令响应情况下,能生成2k图像。X9d品论天涯网

FLUX1.1[pro]将通过Together.ai、Replicate、fal.ai、Freepik等在线平台提供。X9d品论天涯网

同时官方还推出了BFLAPI,可供其他开发者集成到自己的应用程序中,API定价是:X9d品论天涯网

FLUX.1[dev]:每张图2.5美分(约RMB0.18元)X9d品论天涯网

FLUX.1[pro]:每张图5美分(约RMB0.35元)X9d品论天涯网

FLUX1.1[pro]:每张图4美分(约RMB0.28元)X9d品论天涯网

StableDiffusion原班人马打造X9d品论天涯网

FLUX1.1[pro]的背后是StableDiffusion原团队,成员包括RobinRombach、AndreasBlattmann、DominikLorenz等。X9d品论天涯网


X9d品论天涯网

RobinRombachX9d品论天涯网

其实StableDiffusion最初是一个学术研究项目。X9d品论天涯网

由BjörnOmmer教授领衔,RobinRombach、AndreasBlattmann、DominikLorenz等几位慕尼黑大学机器视觉与学习研究小组成员,以及Runway的研究人员PatrickEsser完成。X9d品论天涯网


X9d品论天涯网

研究论文发表七个月后,StabilityAI开始介入,提供计算资源,以进一步开发文本到图像生成模型。2022年,上述几位论文作者加入StabilityAI。X9d品论天涯网

团队一同创建了StableDiffusionXL、StableVideoDiffusion等。X9d品论天涯网

ICML2024最佳论文之一、StableDiffusion3技术论文的RectifiedFlowTransformers,还有SDXL-Turbo使用的对抗扩散蒸馏方法(AdversarialDiffusionDistillation),也是这帮子人在研究。X9d品论天涯网

今年三月份这些核心研究团队成员被曝集体辞职。X9d品论天涯网

而后,他们组成了新团队名为BlackForestLabs(黑森林实验室),总部位于德国。X9d品论天涯网


X9d品论天涯网

今年8月初刚刚宣布成立,并发布了其初代文生图模型FLUX.1,FLUX.1有三个变体:FLUX.1[pro]、FLUX.1[dev]和FLUX.1[schnell],平衡了性能和可访问性。X9d品论天涯网


X9d品论天涯网

目前黑森林实验室已完成种子轮融资,共融资3100万美元,AndreessenHorowitz领投,BrendanIribe、MichaelOvitz、GarryTan、TimoAila和VladlenKoltun等跟投。X9d品论天涯网

据说他们还已经收到GeneralCatalyst、MätchVC的后续投资。X9d品论天涯网

黑森林实验室和马斯克还有合作,将其图像生成模型引入xAI的Grok助手中。X9d品论天涯网

接下来,团队透露将推出SOTA级文本到视频生成模型X9d品论天涯网

据说他们正在以10亿美元的估值筹集1亿美元资金,比之前1.5亿美元的估值大幅上涨。X9d品论天涯网

从Pika1.5到MetaMovieGen,今年下半场视频生成赛道爆火,黑森林实验室的加入,或许会带来不一样的火花。X9d品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]