人工智能

华科大发布AI大模型猴子:部分超越GPT-4

字号+作者: 来源:快科技 2023-12-12 20:48 评论(创建话题) 收藏成功收藏本文

快科技12月12日消息,华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答,能够实现对世界的观察”,对图'...

快科技12月12日消息,华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。XSM品论天涯网

该模型擅长图像描述和视觉问答,能够实现对世界的观察”,对图片进行深入问答交流和精确描述。XSM品论天涯网

XSM品论天涯网

官方介绍称,在18个数据集上的实验中,华科大Monkey模型表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。XSM品论天涯网

此外,Monkey在文本密集的问答任务中显示出显著的优势,甚至在某些样本上超越了业界公认的领先者GPT-4V。XSM品论天涯网

Monkey的一个显著特点是其出色的看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。XSM品论天涯网

另一亮点是能够处理分辨率高达1344 x 896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍。XSM品论天涯网

据悉,目前业内能处理的图片最大分辨率为448448像素。XSM品论天涯网

值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。XSM品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]

相关文章