大模型-大模型文章-品论天涯网

当前位置：首页 > TAG信息列表 > 大模型

伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练

要点:由加州大学伯克利分校研究人员推出的Starling-7B是一款基于Reinforcement Learning from AI Feedback（RLAIF）的开放式大型语言模型(LLM)，采用人工智能反馈来提升其性能，特...
作者：2023-11-29 10:58
大模型跑分家家碾压GPT-4，评测榜单是时候升级了？

声明：本文来自微信公众号“罗超Pro”（ID:luochaotmt），作者:罗超频道，，授权站长之家转载发布。今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”，据不完全统计，今年...
作者：2023-11-29 08:51
“百模大战”家家第一，大模型“跑分”作弊何时休？

声明:本文来自于微信公众号罗超Pro（luochaotmt），授权站长之家转载发布。今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”，据不完全统计，今年1-7月国内共发布...
作者：2023-11-29 08:50
南洋理工推80亿参数多模态大模型OtterHD

要点:1、OtterHD 是一个80亿参数的多模态大模型，可以处理高分辨率图像并具有通用性。2、OtterHD 通过基于 Fuyu-8B 进行指令微调，并使用 FlashAttention 资源库中的算子融合技...
作者：2023-11-27 16:58
AI视野：Azure AI新增40种大模型；Yi-34B-Chat微调模型开源；GPT-4在图灵测试中成功率超过41%；微软谷歌推出AI入门课程

...
作者：2023-11-27 15:14
腾讯披露最新大模型训练方法:Angel框架升级效率提升2.6倍

要点:腾讯披露混元大模型训练方法，Angel框架升级，大模型训练效率提升至2.6倍，千亿级大模型训练可节省50%算力成本。AngelPTM机器学习训练框架通过多维度并行优化存储，在通讯方面...
作者：2023-11-27 14:24
大模型界的“熊猫烧香”，可对文生图模型造成巨大伤害！

声明：本文来自于微信公众号 AIGC开放社区（ID：AIGCOPEN），作者：AIGC开放社区，授权站长之家转载发布。《麻省理工技术评论》分享了一个名为Nightshade的投毒工具，可以对DALL-E、Midjour...
作者：2023-11-26 09:49
LeCun发文质疑LLM推理能力大模型涌现离不开上下文学习

要点:LeCun认为，大语言模型（LLM）缺乏规划推理能力，其涌现能力主要源自上下文学习而非真正的推理。研究表明，针对复杂规划任务，如国际规划大赛中的问题，LLM的性能较差，其推理能力在特...
作者：2023-11-24 17:47
清华大学提出全新加速训练大模型方法SoT

要点:研究人员提出了一种名为“Skeleton-of-Thought（SoT）”的创新方法，旨在加速大型语言模型(LLMs)的生成速度，以解决其处理速度较慢的问题。与传统方法不同，SoT不对LLMs进行复杂...
作者：2023-11-24 09:25
大模型刚收费，年轻人就找搭子

声明:本文来自于微信公众号智商税研究中心（ID:gh_c55b3561ece1），作者:潘哥，授权站长之家转载发布。百度的文心一言收费后，讯飞星火、通义千问、360智脑等AI大模型，会不会跟进?毕...
作者：2023-11-24 08:48

首页上一页 12 13 14 15 16 下一页尾页

排行榜

关注我们

关注微信公众号，了解最新精彩内容