-
伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练
要点:由加州大学伯克利分校研究人员推出的Starling-7B是一款基于Reinforcement Learning from AI Feedback(RLAIF)的开放式大型语言模型(LLM),采用人工智能反馈来提升其性能,特...
作者:2023-11-29 10:58 -
大模型跑分家家碾压GPT-4,评测榜单是时候升级了?
声明:本文来自微信公众号“罗超Pro”(ID:luochaotmt),作者:罗超频道,,授权站长之家转载发布。今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”,据不完全统计,今年...
作者:2023-11-29 08:51 -
“百模大战”家家第一,大模型“跑分”作弊何时休?
声明:本文来自于微信公众号 罗超Pro(luochaotmt),授权站长之家转载发布。今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”,据不完全统计,今年1-7月国内共发布...
作者:2023-11-29 08:50 -
南洋理工推80亿参数多模态大模型OtterHD
要点:1、OtterHD 是一个80亿参数的多模态大模型,可以处理高分辨率图像并具有通用性。2、OtterHD 通过基于 Fuyu-8B 进行指令微调,并使用 FlashAttention 资源库中的算子融合技...
作者:2023-11-27 16:58 -
AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程
...
作者:2023-11-27 15:14 -
腾讯披露最新大模型训练方法:Angel框架升级 效率提升2.6倍
要点:腾讯披露混元大模型训练方法,Angel框架升级,大模型训练效率提升至2.6倍,千亿级大模型训练可节省50%算力成本。AngelPTM机器学习训练框架通过多维度并行优化存储,在通讯方面...
作者:2023-11-27 14:24 -
大模型界的“熊猫烧香”,可对文生图模型造成巨大伤害!
声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权站长之家转载发布。《麻省理工技术评论》分享了一个名为Nightshade的投毒工具,可以对DALL-E、Midjour...
作者:2023-11-26 09:49 -
LeCun发文质疑LLM推理能力 大模型涌现离不开上下文学习
要点:LeCun认为,大语言模型(LLM)缺乏规划推理能力,其涌现能力主要源自上下文学习而非真正的推理。研究表明,针对复杂规划任务,如国际规划大赛中的问题,LLM的性能较差,其推理能力在特...
作者:2023-11-24 17:47 -
清华大学提出全新加速训练大模型方法SoT
要点:研究人员提出了一种名为“Skeleton-of-Thought(SoT)”的创新方法,旨在加速大型语言模型(LLMs)的生成速度,以解决其处理速度较慢的问题。与传统方法不同,SoT不对LLMs进行复杂...
作者:2023-11-24 09:25 -
大模型刚收费,年轻人就找搭子
声明:本文来自于微信公众号 智商税研究中心(ID:gh_c55b3561ece1),作者:潘哥,授权站长之家转载发布。百度的文心一言收费后,讯飞星火、通义千问、360智脑等AI大模型,会不会跟进?毕...
作者:2023-11-24 08:48
-
习近平:在纪念邓小平同志诞辰120周年座谈会上的讲话
-
梁孝:反思现代西方“神话”历史:“古希腊起源”、霸权意识和回溯式目的
-
高建明:美国新一轮社会主义思潮评析
-
余斌:生产力——生活方式”的传导机制及其启示