人工智能

Stability AI发布最新图像生成模型Stable Diffusion XL 1.0

字号+作者: 来源:cnBeta.COM 2023-07-27 08:29 评论(创建话题) 收藏成功收藏本文

StabilityAI宣布推出StableDiffusionXL1.0,这是一个文本到图像的模型,该公司称其为迄今为止"最先进"的版本。StableDiffusionXL1.0在GitHub上以开源形式'...

StabilityAI宣布推出StableDiffusionXL1.0,这是一个文本到图像的模型,该公司称其为迄今为止"最先进"的版本。StableDiffusionXL1.0在GitHub上以开源形式发布,此外还有Stability的API和消费者应用ClipDrop和DreamStudio,Stability声称,与前代产品相比,StableDiffusionXL1.0的色彩"更鲜艳"、"更准确",对比度、阴影和光照效果也更好。Vu5品论天涯网

Vu5品论天涯网

StabilityAI的应用机器学习主管JoePenna在接受采访时指出,StableDiffusionXL1.0包含35亿个参数,可以在"几秒钟内"生成多种长宽比的100万像素分辨率的完整图像。"参数"是模型从训练数据中学到的部分,基本上定义了模型处理问题的技能,这里指的是生成图像。Vu5品论天涯网

上一代稳定扩散模型StableDiffusionXL0.9也能生成更高分辨率的图像,但需要更多的计算能力。Vu5品论天涯网

Penna说:"StableDiffusionXL1.0是可定制的,可以根据概念和风格进行微调。它也更易于使用,只需基本的自然语言处理提示,就能完成复杂的设计。"Vu5品论天涯网

StableDiffusionXL1.0还在文本生成方面进行了改进。Penna说,许多最好的文本到图像模型都很难生成带有可读徽标的图像,更不用说书法或字体了,而StableDiffusionXL1.0却能"高级"地生成文本,而且清晰可读。Vu5品论天涯网

此外,据SiliconAngle和VentureBeat报道,StableDiffusionXL1.0支持内绘(重建图像的缺失部分)、外绘(扩展现有图像)和"图像到图像"提示--这意味着用户可以输入一张图像并添加一些文字提示,以创建该图像的更多细节变化。此外,该模型还能理解用简短提示给出的复杂、多部分指令,而以前的StableDiffusion模型则需要较长的文本提示。Vu5品论天涯网

Vu5品论天涯网

StableDiffusionXL1.0生成的图片。图片来源:StabilityAI
Vu5品论天涯网

他补充说:"我们希望,通过发布这个功能更强大的开源模型,图像的分辨率不会是唯一翻两番的地方,而且还能让所有用户大大受益。"Vu5品论天涯网

但与之前版本的StableDiffusion一样,该模型也引发了棘手的道德问题。从理论上讲,开源版本的StableDiffusionXL1.0可以被不怀好意者用来生成有毒或有害的内容,比如未经同意的深度伪造。这在一定程度上反映了用来训练它的数据:来自网络的数百万张图片。Vu5品论天涯网

无数教程展示了如何使用稳定人工智能自己的工具(包括稳定扩散的开源前端DreamStudio)来创建深度伪造内容。还有无数教程展示了如何微调基础稳定扩散模型来生成色情内容。Vu5品论天涯网

Penna并不否认滥用的可能性--他也承认该模型存在一定的偏差。但他补充说,StabilityAI已经采取了"额外措施",通过过滤模型训练数据中的"不安全"图像、发布与问题提示相关的新警告以及尽可能多地屏蔽工具中的个别问题术语,来减少有害内容的生成。Vu5品论天涯网

StableDiffusionXL1.0的训练集还包括一些艺术家的作品,这些艺术家曾抗议包括StabilityAI在内的公司将他们的作品用作生成式人工智能模型的训练数据。StabilityAI声称,至少在美国,合理使用原则免除了它的法律责任。但这并没有阻止几位艺术家和图片公司GettyImages提起诉讼,要求停止这种做法。Vu5品论天涯网

稳定人工智能公司(StabilityAI)与初创公司Spawning合作,尊重这些艺术家的"退出"请求,该公司表示,它还没有从训练数据集中删除所有标记的艺术作品,但它"将继续采纳艺术家的请求"。Vu5品论天涯网

"我们正在不断改进稳定扩散的安全功能,并认真地继续迭代这些措施,"Penna说。"此外,我们还承诺尊重艺术家的要求,将其从训练数据集中删除。"
Vu5品论天涯网

在发布StableDiffusionXL1.0的同时,StabilityAI还在其API的测试版中发布了一项微调功能,允许用户使用少至五张图片来"专业化"生成特定的人物、产品等信息。该公司还将把StableDiffusionXL1.0移植到亚马逊用于托管生成式人工智能模型的云平台Bedrock上,扩大了之前宣布的与AWS的合作。Vu5品论天涯网

Stability公司在商业化道路上遭遇低谷,面临着来自OpenAI、Midjourney等公司的激烈竞争,因此该公司推动建立合作伙伴关系并开发新功能。今年4月,Semafor报道称,迄今为止已募集到1亿多美元风险资金的StabilityAI公司正在烧钱--这促使该公司在6月完成了一笔2500万美元的可转换票据,并猎聘了一名高管来帮助提高销售额。Vu5品论天涯网

"最新的SDXL模型代表了StabilityAI的创新传统和能力的下一步,即为人工智能社区提供最前沿的开放式访问模型,"StabilityAI首席执行官埃马德-莫斯塔克(EmadMostaque)在一份新闻稿中说。"在亚马逊Bedrock上发布1.0版本表明了我们与AWS合作,为开发者和客户提供最佳解决方案的坚定承诺"。Vu5品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]