-
8个月238个大模型,中国AI奔向何处?
声明:本文来自微信公众号“光锥智能”(ID:guangzhui-tech),作者:郝鑫、黄小艺,编辑:刘雨琦,授权站长之家转载发布。文|郝鑫、黄小艺编|刘雨琦2022年11月30日,是ChatGPT面世的第一...
作者:2023-12-06 08:45 -
AI大模型,如何破圈而出?
一年即将过去,回望整个2023,我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过200个大模型,形成了名副其实的...
作者:2023-12-05 11:13 -
不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:佳琪,授权站长之家转载发布。增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模...
作者:2023-12-04 16:41 -
哈工深发布多模态大模型九天 性能提升5%
要点:九天(JiuTian-LION) 是哈尔滨工业大学(深圳)发布的全新多模态大语言模型,通过双层视觉知识增强,在13个视觉语言任务上取得了state-of-the-art性能,特别在Visual Spatial Rea...
作者:2023-12-04 13:55 -
文字序顺不响影GPT-4阅读理解,别的大模型都不行
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色 ,授权站长之家转载发布。研表究明,汉字序顺并不定一影阅响读(对于英文来说,则是每一个单词中的字母顺序)。现在,日本东京大...
作者:2023-12-04 13:46 -
一言不合就跑分,国内AI大模型为何沉迷于“刷榜”
声明:本文来自于微信公众号 三易生活(ID:IT-3eLife),作者:三易菌,授权站长之家转载发布。“不服跑个分”这句话,相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等...
作者:2023-12-03 10:12 -
OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」
Anthropic的模型可解释性团队,从大模型中看到了它的「灵魂」——一个可解释的更高级的模型。声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。为...
作者:2023-12-02 09:04 -
280万大模型中文开发者拿到最后一块拼图
声明:本文来自于微信公众号 硅星人Pro(ID:Si-Planet),作者:油醋,授权站长之家转载发布。2023年5月,微软CEO纳德拉抛出一个惊人数字,未来全球的开发者数量将会达到10亿。那时候Meta...
作者:2023-12-01 14:15 -
英特尔推Extension for Transformers工具包 大模型推理性能提升40倍
要点:通过该工具包,使用英特尔® 至强® 处理器可实现大型语言模型(LLM)推理性能加速达40倍,满足各种应用需求。工具包提供轻量级但高效的LLM推理运行时,优化了内核,支持多种量化...
作者:2023-11-30 17:44 -
北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人
要点:北大和中山大学研究者提出的Chat-UniVi是一种统一的视觉语言大模型,能够在统一的视觉表征下同时处理图片和视频任务,且仅需三天训练即可获得130亿参数的通用视觉语言大模...
作者:2023-11-29 14:25
-
习近平:在纪念邓小平同志诞辰120周年座谈会上的讲话
-
梁孝:反思现代西方“神话”历史:“古希腊起源”、霸权意识和回溯式目的
-
高建明:美国新一轮社会主义思潮评析
-
余斌:生产力——生活方式”的传导机制及其启示