一个神秘的新图像生成模型在众包人工分析基准测试中击败了Midjourney、黑森林实验室和OpenAI的模型。这个名为"red_panda"的模型在人工分析的文本到图像排行榜上领先排名第二的黑森林实验室的Flux1.1Pro约40个Elo分数。ArtificialAnalysis使用Elo(一种最初开发用于计算棋手相对技术水平的排名系统)来比较其测试的各种模型的性能。
与社区人工智能基准ChatbotArena类似,ArtificialAnalysis通过众包的方式对模型进行排名。对于图像模型,ArtificialAnalysis会随机选择两个模型,并向它们提供一个独特的提示。然后,它会展示提示和生成的图像,用户选择他们认为更能反映提示的图像。
当然,这个投票过程存在一定的偏见。ArtificialAnalysis的投票者大多是人工智能爱好者,他们的选择可能无法反映广大生成式人工智能用户的偏好。
不过,就生成速度而言,red_panda也是排行榜上表现较好的模型之一。该模型生成图像的时间中位数约为7秒,比OpenAI的DALL-E3快100多倍。
那么,red_panda从何而来?是哪家公司生产的?什么时候能发布?这些都是很好的问题。不过,人工智能实验室越来越多地使用社区基准来在发布前鼓动人们的期待。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】