声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:杨净,授权站长之家转载发布。
小米集团技术委员会AI实验室大模型团队负责人栾剑,在MEET2024智能未来大会上,透露了小米大模型独有的方法论。
作为大模型应用的先行者、率先在手机端跑通大模型的小米,早早将轻量化和本地部署作为自身大模型应用突破点。现场栾剑表示将大模型搭载到硬件设备里面去充当大脑,是件很酷的事情。
图源备注:图片由AI生成,图片授权服务商Midjourney
面对当下大模型发展趋势, 他坦言:从技术参数上秀肌肉已经没什么意义,接下来应该回归到怎么应用。而大模型应用成败的关键,栾剑认为主要在两个关键点:
一是流量入口,二是用户粘性。
为了完整体现栾剑关于大模型的研发和应用思考,量子位在不改变原意的基础上,对他的演讲内容进行了编辑整理。
关于MEET智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。今年共有数十家主流媒体及直播平台报道直播了MEET2024大会,吸引了超过300万行业用户线上参会,全网总曝光量累积超过2000万。
演讲亮点
小米科技战略总结成公式就是(软件×硬件)AI,这是科技行业第一家将AI放在指数位置上的公司。我们认为AI是全新的生产力,会对未来软硬件产品发展和变化带来深刻影响。
假设我们将大模型作为硬件设备的大脑,搭载到硬件设备里面去,这将是件很酷的事情。小米要做的,不是通用大模型、垂类大模型,而是场景大模型。
轻量化和本地部署是小米大模型突破点。
大模型有三个要素,分别是大数据、大参数、大训练任务。
大模型从技术参数上来秀肌肉我觉得没什么意义了,接下来应该回归到怎么把大模型用好。
云边端结合是将来大模型发展而一条重要途径。要实现云边端的结合肯定离不开软件层面上打通。
大模型应用成败两个关键点:一个在流量入口,另一个在用户粘性。
主动智能是小米澎湃OS非常重要的亮点。
小米全新升级的「人车家全生态」战略,为大模型的应用搭好了舞台。
首家将AI放在战略指数位置的公司
今天跟大家分享一下小米大模型的研发思路,以及大模型在小米接下来可能的应用场景。
今年8月份,小米宣布了自己的科技战略:深耕底层技术,长期持续投入,软硬深度结合,AI全面赋能。总结成公式就是(软件×硬件)AI。
作为科技行业第一家将AI放在指数位置上的公司,我们认为AI是全新的生产力,会对未来软硬件产品发展和变化带来深刻影响,所以一定要重视AI、投入AI,这也是将小米打造成硬核科技公司的必由之路。
AI既然这么重要,小米AI上的积累有哪些呢?今天就来简单回顾一下。
早在2016年,小米内部创建首个专注AI的视觉团队,主打为手机拍照服务。随后成立了语音声学、人机对话、知识图谱等一系列AI团队,小米AI实验室应运而生。
经过两年多努力,小米所有产品都用上自研的AI技术,当业务部门需要支援时,我们也能派出大量专家帮助快速组建技术团队。发展到今天,小米各个部门都散布着我们的AI工程人员。
从另一个维度看,小米在技术上的投入近几年持续高速增长,最近几年复合增长率达到38.4%,今年我们的投入会达到200亿元,最近5年(2022-2026)会投入到一千个亿。这是非常可观的一笔投入,说明我们技术团队在持续成长,也说明我们践行小米科技战略的决心。
今年提到AI一定绕不开大模型,今年4月份小米宣布成立大模型团队,将轻量化和本地部署作为小米大模型突破点。
不少同行来问背后的原因。
首先看小米的特色。小米有各种各样的硬件设备,今天小米是全球最大消费级IoT平台。截至今年三季度,小米IoT平台已连接设备6.99亿,5台以上的小米设备用户达到1370万。
假设我们将大模型作为硬件设备的大脑,搭载到硬件设备里面去,这将是件很酷的事情。
比如有台扫地机器人,大概率我们不会跟它聊天,不会让它帮写小作文,但它需要路径规划、躲避障碍物以及判断什么地面需用什么方法清洁。
将这种能力总结一下,可能并不是行业所说的通用大模型,也不是垂类大模型,而是场景大模型,这也是小米特别关注的以及所要做的。
我们认为,大模型有三个要素,分别是大数据、大参数、大训练任务。哪个要素才是大模型产生涌现能力、泛化能力的关键?我们做了一些实验。
今年8月份发布的两个大模型,参数量分别在13亿和60亿,并在中文的两个主要榜单上做了测试。其目的是验证端侧大模型(参数不那么大)通过定制和优化,是否能在目标场景中达到媲美云端大模型效果。
第二步,是验证端侧大模型是否能在手机上正常运行,达到用户真实使用条件要求。10月,小米在高通骁龙8Gen3芯片上基于NPU在手机端跑通60亿参数模型,生成速度和功耗完全满足正常使用的要求。
到这一步为止,我们把大模型搭载到设备端的设想得到全部验证。从技术参数上来秀肌肉我觉得没什么意义了,接下来我们回归到怎么把大模型用好。
目前AI大模型技术应用已经深入小米全系统,包括实时字幕、小爱输入助手、图像生成与搜索等技术等。大模型在端侧上的功能探索只是刚刚开始,使用价值绝对不仅止于此。
主动智能是小米澎湃OS非常重要的亮点
接下来展望一下大模型在小米会发生什么变化。
前面提到,将大模型作为大脑放到智能设备里去,就能独立完成一些简单任务,但在复杂条件下,可能还需要同场景多设备协同。
这时候一个设备就完成不了了,请求会上升到边缘设备。边缘设备就是一个场景里算力和存储能力最强的设备。通过这台设备协同场景下所有智能设备帮我们一起完成。当请求变得更为复杂时候,需要跨场景,这时候请求就需要上升到云端了。
这样做的主要目的是什么?
大模型服务成本很高,用户使用成本也很高。我们做分布式计算,尽量把计算放到边缘侧,放到端侧,这样让用户使用成本降到最低。
存储也是基于同样的考虑,用户数据,也是能放到端侧就放到端侧,能放到边缘侧就放到边缘侧,这样也是最大程度地从物理上保护用户数据的隐私安全。
云边端结合是将来发展的一条重要途径。要实现云边端的结合肯定离不开软件层面上打通。
小米近期发布的澎湃OS操作系统,就是为了万物互联而设计,我们在澎湃操作系统里有个AI子系统,它是个思考中枢。
如果将智能设备比喻成小动物,这个智能中枢就可以理解成驯兽师或魔法师。通过智能设备延伸它的感官,充分采集用户所在环境的信息。获取信息之后,再由Xiaomi HyperMind做思考判断以及规划,再将指令下发到需要执行的智能设备上,让它们协同完成任务。
更重要的是,Xiaomi HyperMind是有学习能力的,除了被动地完成用户的请求以外,还能在用户使用一段时间以后了解到用户的使用习惯,产生与用户的默契。在它发现当前场景和以前某个场景比较相似的时候,会主动地做一些用户建议并提供一些服务。
主动智能也是小米澎湃OS非常重要的亮点。
今年我们将小米集团战略从手机xAIoT升级到「人车家全生态」,为大模型的应用搭好了舞台。
可以想象一下,每台智能设备上面都有符合它自己能力的大脑,能够独立完成任务。他们通过小米澎湃OS互联互通到一起,然后通过Xiaomi HyperMind控制它们。我们通过云边端架构为用户提供最经济安全的服务,这是个非常了不起的框架,我们希望用3-5年将框架填满。
大模型应用成败两个关键点
最后聊聊关于大模型应用,大家都在探索一个问题:大模型应用成败关键是什么?我个人抛个砖,我认为所有应用可能都有两个关键点:一个是流量入口,一个是用户粘性。
大模型流量入口在哪里?最开始大家觉得是行业应用,还是需要点开APP用大模型赋能,后来发现大模型自己可以成为一个入口,通过调用API来完成复杂的任务。
刚才说了大模型可以跟操作系统深度融合。归根到底操作系统需要一个硬件,大家不可能跟空气交互,一定要找到硬件,硬件才是入口,而小米绝对不缺硬件。
第二个用户粘性。打个比方,当一个城市开通第一条地铁线时,大家可能会觉得很新鲜很好奇,但可能不会特别依赖它;但当它形成一个无处不在的网络时,大家对地铁的依赖成长起来了。
大模型现在就是这样的情况。现在大模型的主要使用方式还停留在简单的文字交互,我们要探索的是让大模型怎么无处不在地融入大家日常生活。
小米已经搭好了人车家全生态的平台,非常欢迎大家一起来共同建设,把大模型的应用做好。
最后回顾一下小米的科技理念。我们要选择对人类文明有长期价值的技术领域,并坚持长期持续投入。
而以大模型为代表的AI,我认为就是对人类文明有长期价值的技术领域。
我们要坚持投入,无论外界舆论发生怎样的变化,无论技术上出现怎样的挑战,我们都要保持战略定力,我们要坚韧乐观,用最前沿的技术提供最优质的产品和服务,希望让更多朋友们能够通过小米的产品体验到科技带来的美好生活。
我今天就讲到这里,谢谢大家。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】