声明:本文来自于微信公众号 雷科技(ID:leitech),作者:TSKnight,授权站长之家转载发布。
当未来的人类回望历史,或许会将2023年称为AI元年,AI大模型以一种野蛮的方式,闯入你我的生活之中,而且进步的速度一日千里,从问答对话到辅助编程,从图画解析到自主创作,AI所展现出来的能力,超出了多数人的预料,让不少人惊呼:“未来是属于AI的”。
随着ChatGPT的公布,全球主要的科技企业都开始加快AI大模型的研发,为这个崭新的领域带来无限的可能,接下来,我们将盘点在过去的一年里,创新性、应用领域、AI性能均排名前列的十个AI大模型,让大家可以轻松了解目前AI大模型最前沿的实力。(以下排名不分先后,以首字母(拼音)顺序进行排列)。
1.ChatGPT:AI大模型「开山祖师」
ChatGPT被誉为AI大模型的始祖,由OpenAI开发并在2022年11月首次对外公布,作为首个现象级AI模型,ChatGPT如今已经迭代到了4.0版本,拥有远超ChatGPT3.5的处理能力,而且支持插件加载、实时网络连接等多个功能。
目前,人们已经为ChatGPT4.0设计了成千上万个不同功能的插件,从编程到画画,从写诗到编曲,ChatGPT可以说样样精通。当然,能够实现这些功能,主要还是因为ChatGPT本身就是一个多模态AI模型,可以识别并分析多种数据。
ChatGPT也是目前多数人可以接触到的最强AI模型。
2.Claude:OpenAI「后花园」
Claude的名字大家或许比较陌生,不过背后的团队却大有来头,创始人Dario Amodei为前OpenAI副总裁,带领部分员工创办了Anthropic,经过一系列的改进与升级,如今的Claude被认为是仅次于ChatGPT的AI模型,并且更擅长处理长语言文本。
Claude在近期经过升级后,最大可支持200k的文字输入,远超ChatGPT4.0Turbo的128K,不过,相对于ChatGPT活跃的用户生态,Claude的使用人数和应用范围都相对小很多。
但是,在前段时间的OpenAI内部动乱期间,Claude还是成为许多企业的备用选择。因为Claude的团队核心成员大多来自OpenAI,所以某种程度上可以视为ChatGPT的弱化版,虽然综合性能上不如ChatGPT强大,但是在长文本阅读、回答等方面有一定的优势。
3.Gemini:背靠巨头的「小萌新」
从发布时间来看,Gemini无疑是AI模型领域的“萌新”,但是从官方描述来看,其实力之强恐怕只有ChatGPT可以与其扳手腕。Gemini是谷歌AI实验室的作品,同时也是一个多模态模型,可以同时处理文字、音频、图像等多种数据,使得Gemini拥有出色的多任务处理能力。
不过,Gemini发布没多久就闹出了笑话,在回答中称自己是百度开发的文心一言(中文语境下)或OpenAI开发的ChatGPT(英文语境下),虽然后续谷歌对Gemini进行了紧急维护,封堵了漏洞,但是依然引发了网友的热烈讨论。
目前Gemini还处在测试阶段,谷歌的这个多模态大模型能否超越ChatGPT仍然是个未知数,但是至少从体验来看,Gemini综合了谷歌旗下不少AI模型的优点,在实际使用中或许能够给你带来惊喜。
4.华为云盘古:全生态AI引领者
华为云的盘古AI大模型虽然在普通人中知名度不高,但是在行业中的商业化道路却是走得最远、最广的,盘古AI大模型包括了NLP大模型、CV大模型、科学计算大模型等多个AI大模型在内的合集,使其可以被应用到科学研究、教育、交通、工业等多个行业中。
为了更好的发挥AI大模型性能,华为结合自身的产业及产品优势,让盘古AI大模型进入到矿山、政务、金融、气象等多个领域中,并且已经落地部署了多种应用。此外,盘古AI大模型还是首个训练参数超千亿的中文大模型,整体实力名列前茅且在工业领域的应用已然领先。
5.LLaMA2:人气超群的「元宇宙」玩家
LLaMA2是由互联网巨头Meta开发的AI模型,作为一个开源的AI模型,LLaMA2能够提供参数量从7B到65B的不同AI模型,为不同需求的用户提供服务。得益于LLaMA2出色的效率,即使在参数量较低的情况下,其依然能够表现出不错的性能,使得其在小型及移动设备上的本地化部署更有优势。
相较于LLaMA,LLaMA2在多语言处理方面有所增强,同时强化了自然对话能力和长文本理解能力,生成的内容连贯性更强,降低了出现错误内容的几率,结合开源特性,使其可以得到快速的应用和普及。
在多项测试中,LLaMA2的实际成绩都在开源模型中名列前茅,使其成为最受欢迎的开源AI模型之一,虽然LLaMA2距离ChatGPT等头部AI模型还有不小距离,但是它仍然是AI爱好者及中小企业的不错选择。
6.通义:直面用户、贴地飞行
通义是由阿里推出的中文AI大模型系列,同时也是小雷熟悉的模型之一,目前通义旗下有通义千问、通义万相、通义灵码等多个AI模型入口,可以帮助解决许多问题,比如通义千问就是一个自然对话AI模型,并且提供基于文字的多种用途功能。
通义千问作为阿里的中文AI大模型,在商务信息等数据的查询上更有优势,准确率也更高。目前,通义2.0已经升级为拥有千亿参数量的AI模型,在语言理解、问题判断等方面都有更好的表现,接下来,阿里打算让其接入钉钉等旗下App,为用户提供实时的在线AI支持,甚至支持AI下单等多样化功能。
基于阿里的产品生态矩阵,通义大模型已经在多个App中落地并为用户提供服务,可以说是国产大模型中与用户关系最紧密的一个,从钉钉到淘宝你都能看到通义大模型的身影,感兴趣的朋友不妨去试试淘宝的淘宝问问功能,会有不少惊喜。
7.文心一言:谷歌都要「学习」的中文大模型佼佼者
文心一言是由百度推出的新一代知识增强大语言模型,得益于百度在AI技术领域的长期投入和搜索引擎市场的领导地位,文心一言是国内进步速度最快的AI大模型,在各类写作、文案创意、问答、咨询、代码等方面都有出色的表现,而且能够提供更契合中文语境的内容。
目前,文心一言网页端的一言百宝箱中提供丰富的应用场景和prompt模板,基本覆盖国内网友的日常需求,还有丰富的插件商城,包括PPT助手,长文档摘要问答,学术检索助手、思维导图等拓展大模型的能力。
不得不说,文心一言在对用户的需求探知上做得很不错,提供了许多有意思的功能,目前文心一言已经免费开放,是基于文心3.5版本,如果想体验更强大的文心大模型4.0版本,则需要开通会员,不过就小雷的体验来说,性价比还是很高的。
8.讯飞星火:AI领域的「翻译官」
讯飞星火,看名字就知道是谁的产品,讯飞作为国内头部人工智能企业,在语音合成识别、多语种、认知智能等方面具有显著优势,在涉足AI模型领域后也将自己的优势发挥得淋漓尽致,在语音对话、翻译、文案撰写等方面的表现非常不错,而且基于星火大模型,讯飞也在整合旗下的多款硬件产品,让用户可以随身携带和使用星火大模型。
目前,讯飞星火的参数量级已经突破千亿,并且在测试中领先于ChatGPT,不过依然落后于ChatGPT4.0,按照讯飞的计划,星火AI大模型将在2024年上半年达到ChatGPT4.0的水平。
此外,讯飞星火还推出了内容大师等客户端及App,帮助用户建立更直接、方便的使用方案,辅佐用户更好的管理内容发布、创作、审核等工作,在AI的帮助下,我们的工作效率正在得到显著提升。
9.有道子曰:智慧化教育的「紫薇星」
有道子曰是网易推出的新一代教育大模型,这是有道针对教育场景所研发的垂直品类大模型,也是首批获得国家相关认证的大模型之一。网易有道此前推出了大模型翻译、作文指导、语法精讲、虚拟人口语教练、AIBox、等六大创新应用,并已经落地到有道词典、有道词典笔、有道学习机等多种软硬件产品中。
子曰是少见的针对性垂直大模型,相对于通用类大模型,在教育领域的应用表现尤为突出。这款模型结合了先进的自然语言处理技术,特别适用于教育环境,能够提供个性化学习体验和增强教学效果。
通过将教育大模型与软硬件产品的结合,子曰大模型的应用场景得到了广泛的拓展,其用户体验在很多方面超越了通用大模型。与通用大模型相比,子曰在教育领域能够为学习者提供个性化的学习体验,帮助获得更高效的学习成果。随着在线教育日益受到重视,子曰大模型的发展前景非常广阔。
10.智谱AI:手机、车载领域的新宠儿
智谱AI虽然名气没有通义、文心、星火等AI模型大,但是背后的团队却是最早进入AI模型领域的力量之一,智谱AI早在2021年就发布了自研的GLM百亿参数模型,并且在今年10月发布了第三代基座大模型ChatGLM3,为业界提供了1.5B和3B的小型AI模型,可以被快速部署到手机乃至车载平台中。
作为国内最早开源的AI模型之一,智谱AI对国内的AI模型发展贡献了很多力量,目前也依然出于领先地位,相对于其它AI模型,智谱AI在效率等方面都有这出色的表现,加上开源性质,使其成为国内不少中小企业的合作对象。
结语
在过去的一年里,AI大模型的发展和应用达到了新的高度,它们不仅在技术上取得了显著进步,还在多个领域中展现出了广泛的应用潜力。
从ChatGPT的多功能性到Claude的长文本处理,再到Falcon的开源特性和华为盘古的商业应用,每个模型都以其独特的方式为AI的进步和普及做出了贡献。无论是谷歌的Gemini、阿里的通义,还是百度的文心一言、讯飞星火和智谱AI,这些AI大模型都在不断推动技术界限,提高人工智能的效能和可达性。
2023年的AI发展标志着一个新时代的开始。这些AI大模型不仅代表了技术的前沿,也预示着未来的发展方向。随着这些模型继续进化和扩展其应用范围,我们可以期待AI在更多领域中发挥关键作用,为我们带来更多的创新和便利。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】