在7月4日下午举行的2024世界人工智能大会科学前沿主论坛上,由中国科学技术信息研究所联合北京大学共同研制的《2023全球人工智能创新指数报告》(“以下简称《报告》”)正式发布。中国科学技术信息研究所党委书记、中国软科学研究会副理事长赵志耘在发布时介绍,尽管总体格局上,美国和中国稳居第一梯队,但中国尚未形成具有绝对领先优势的核心竞争力。
该《报告》聚焦基础支撑、资源与环境、科技研发、产业与应用、国际合作交流等5个维度构建指标体系,对46个重点国家的人工智能创新发展和治理情况进行量化评估。澎湃科技注意到,综合考虑总得分、国家间分差、一级指标排名等因素,报告将参评国家划分为四个梯队,美国和中国稳居第一梯队,总得分明显高于其他国家,第二梯队与第一梯队的差距进一步拉大。
中美两国AI水平稳居第一梯队
总体格局上,2023年全球人工智能美国和中国稳居第一梯队,英国、日本、新加坡等9个国家位居第二梯队。其中,美国以74.71的总分大幅领先,中国总分为52.69分,排名第二,比排名第三的英国高出近15分。美国全面领先,中美在多数指标上处于“断层式”领先。自指数创建五年来,美国一直排名全球第一,中国从2020年起近四年一直排名第二。
《报告》指出,美国和中国在人工智能高层次人才数量和人工智能企业数量上均领先于第二梯队国家。在主要国家人工智能顶级论文数量和主要国家人工智能专利授权数量上,中国远高于美国。比如,在主要国家人工智能顶级论文数量占比上,中国占比36.7%,美国占比22.6%。在主要国家人工智能专利授权数量占比上,中国占比34.7%,美国占比32%。
《报告》也提到,第二梯队中,英国在整体教育资源和高质量的学术研究成果方面比较突出,日本专利也较为突出。德国在产业和应用方面,尤其是在人工智能风险投资以及国内市场规模方面很有优势。第三、四梯队部分国家有所进步,其中印度和沙特阿拉伯连续三年排位上升。
学习模型研发数量中,美国人工智能企业表现突出
统观当下全球人工智能创新发展趋势,赵志耘提到了当下全球趋势呈现四个特点。
趋势一,大模型的突破带动人工智能技术创新加快,自然语言处理、多模态等领域研发提速。多模态领域的模型数量大幅增长,从2022年的9个增加到2023年的35个。需要注意的是,2023年AIforScience持续深入,面向生物/医药、地球科学、数学、材料科学等科研领域的机器学习模型不断涌现。
趋势二,产业界在模型开发上的领先优势凸显。《报告》显示,2023年产业界独立研发的机器学习模型达到176个,是学术界的3.5倍。
澎湃科技注意到,在2023年机器学习模型研发数量的机构中,美国人工智能企业表现尤为突出,2023年推出2个以上机器学习模型的13家机构中,美国7家,研发学习模型数量最多的来自Google,数量达到19个。中国2家(阿里巴巴、北京智源人工智能研究院)、英国、加拿大、法国、阿联酋各占1家。
《报告》同时还提及,近十年产业界独立研发的机器学习模型数量占比从2013年的25%上升到2023年的62.6%,学术界却不断下降,与产业界的差距拉大。
趋势三,生成式人工智能开源项目激增,开源仍是人工智能技术研发应用的重要模式。《报告》指出,近十年GitHub上人工智能开源项目总数持续增长,从2013年的1.2万个增加到2023年的约190万个。印度成为最大的开源项目来源国,每年贡献的人工智能开源项目数量占全球的比重从2013年的3.1%增长到2023年的27.3%,2020年开始反超美国。
趋势四,人工智能企业新增数量开始增长,2023年生成式人工智能风险投资规模急剧扩大,主要集中在美国、法国、中国、以色列、英国等国家。在过去的2018-2022年,全球新增人工智能企业数量在逐年递减,但是这种递减趋势在2023年得到了抑制,同时有回转的倾向,2023年新增企业数量同比上涨了21.5%。
同时有一个更为乐观的趋势是,全球人工智能风险投资额虽然还是下降的趋势,但是这种下降的幅度在明显缩减。尤其是2023年生成式人工智能的风险投资规模在快速扩大,也使得生成式人工智能在推动人工智能创新发展方面起到非常重要的作用。
原始创新需要加强
《报告》指出,中国人工智能综合水平保持全球第二,但尚未形成具有绝对领先优势的核心竞争力。在人才培养、科研产出、产业发展等方面,中国取得积极成效。
在高层次人工智能人才队伍上,顶会顶刊论文作者数量从2018年的328人增长到2022年的1674人,与美国的差距正逐渐缩小。高质量科研成果数量明显上升,顶会顶刊论文数量已经超过美国,位居全球第一,累计贡献的高影响力人工智能开源项目目前位居全球第三,仅次于美国和印度。
不过,赵志耘指出,从当前主流技术路线的趋势特征以及支撑技术大规模应用的基础条件来看,中国人工智能发展还存在一些不足,尤其在数据开发利用、原始创新等方面需要进一步加强。
《报告》也同时提到对中国人工智能发展的建议及展望。
赵志耘表示,应加快高水平规模化的应用,这将是中国最大的优势。此外,加强数据资源建设,健全公共数据开放共享机制,建设安全合规、大规模、高质量的语料库。加大高层次人才引育,加快高水平规模化应用,聚焦关键领域打造一批具有技术先进性和规模化潜力的重大场景,推动大小模型协同落地。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】