人工智能

Stability AI 发布用于生成声音和歌曲的开放式AI模型

字号+作者: 来源:cnBeta 2024-06-06 09:32 评论(创建话题) 收藏成功收藏本文

人工智能艺术生成器StableDiffusion背后的初创公司StabilityAI发布了一个用于生成声音和歌曲的开放式人工智能模型,并声称该模型完全是在免版税录音基础'...

人工智能艺术生成器StableDiffusion背后的初创公司StabilityAI发布了一个用于生成声音和歌曲的开放式人工智能模型,并声称该模型完全是在免版税录音基础上训练出来的。该模型名为"稳定的音频开放",它采用文本描述(例如,"在经过处理的录音室中演奏的摇滚节拍,在原声套件上打鼓"),并输出长度不超过47秒的录音。kUx品论天涯网

该模型使用来自免费音乐库FreeSound和免费音乐档案馆的约486,000个样本进行训练。kUx品论天涯网

kUx品论天涯网

StabilityAI公司称,该模型可用于为视频、电影和电视节目创建鼓点、乐器旋律、环境噪音和"制作元素",也可用于"编辑"现有歌曲或将一首歌的风格(如流畅爵士乐)应用到另一首歌中。kUx品论天涯网

StabilityAI公司在其公司博客上发表的一篇文章中写道:"此次开源发布的一个主要好处是,用户可以根据自己的自定义音频数据对模型进行微调。例如,鼓手可以在自己的鼓声录音样本上进行微调,生成新的节拍。"kUx品论天涯网

不过,StableAudioOpen也有其局限性。它不能生成完整的歌曲、旋律或人声,至少不能生成好的歌曲、旋律或人声。StabilityAI表示,它并没有为此进行优化,并建议希望获得这些功能的用户选择该公司的高级StableAudio服务。kUx品论天涯网

StableAudioOpen也不能用于商业用途,其服务条款禁止这样做。此外,它在不同音乐风格和文化或英语以外的语言描述中的表现也不尽相同,StabilityAI将这些偏差归咎于训练数据。kUx品论天涯网

"数据源可能缺乏多样性,所有文化在数据集中都不具有同等代表性,"StabilityAI公司在对模型的描述中写道。"模型生成的样本将反映训练数据的偏差"。kUx品论天涯网

稳定人工智能公司(StabilityAI)长期以来一直在努力扭转业务颓势,最近,该公司负责生成音频的副总裁埃德-牛顿-雷克斯(EdNewton-Rex)因不同意该公司关于在受版权保护的作品上训练生成人工智能模型构成"合理使用"的立场而辞职,从而引发争议。StableAudioOpen似乎试图扭转这种说法,同时不着痕迹地宣传StabilityAI的付费产品。kUx品论天涯网

随着包括Stability音乐生成器在内的音乐生成器越来越受欢迎,版权--以及一些生成器创建者可能滥用版权的方式--正成为人们关注的焦点。kUx品论天涯网

5月,代表比利-乔尔(BillyJoel)、DojaCat和LilNasX等艺术家的索尼音乐公司致函700家人工智能公司,警告不要"未经授权使用"其内容来训练音频生成器。今年3月,美国田纳西州签署了第一部旨在遏制人工智能在音乐领域滥用的法律。kUx品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]