知名数据档案馆安娜的档案日前发布博客宣布已经成功备份几乎整个Spotify平台的音乐文件,后者是全球用户规模最大的流媒体音乐平台,此次被安娜的档案抓取应该是某些安全措施没有做到位导致的。
安娜的档案称,此前该档案馆发现某种能够大规模抓取Spotify平台数据的方法,随后该档案馆意识到或许可以通过数据建立用于保存音乐的音乐档案馆,接下来就是抓取数据。
最终抓取的数据和概述如下:
Spotify作为全球规模最大的流媒体音乐平台目前拥有2.56亿首歌曲,其中99.9%的歌曲已经被抓取;
安娜的档案成功存档8600万首音乐文件,约占总播放量的99.6%,整体数据大小约为300TB;
按照Spotify平台受欢迎程度来确定歌曲的优先级,用户可以查看排名前10000的歌曲榜单;
对于流行程度非零的歌曲几乎都已经抓取,75kbit/s的OGGOpus格式;
添加元数据时没有对音频文件进行重新编码,但提供差异文件存档,包含原始哈希和元数据文件用于重建;
对于流行程度为零的歌曲大约抓取了50%,音频被重新编码为75kbit/s的OGGOpus格式,这种音质较低但体积小;
数据截止至2025年7月,也就是在此之后上架的音乐或更新都不包含在下载数据内。
由于数据非常大安娜的档案将以BT种子形式发布数据,也就是说除非所有人都已经放弃这部分数据,否则数据将BT形式流传在整个互联网上,任何人想要将其彻底清除都几乎是不可能的事情。
不过需要说明的是目前数据还在构建并计划分阶段发布,暂时发布的数据只有歌曲的元数据,接下来音乐文件、附加文件元数据、专辑封面以及zstdpatch文件等都将分阶段发布,具体发布时间未知。

相关文章


头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】