中国科学技术信息研究所所长,科技部新一代人工智能发展研究中心主任赵志耕图/主办方供图

5月28日,中国科学技术信息研究所所长,科技部新一代人工智能发展研究中心主任赵志耕在中关村论坛平行论坛“人工智能大模型发展论坛”上发布了《中国人工智能大模型地图研究报告》。据她披露,据不完全统计目前国内已经发布了79个大模型,从地区来看北京和广东最多,自然语言处理是大模型研发最活跃的领域。

全球已发布认知大模型 中美共占80% 国内已有79个大模型

赵志耕介绍,在全球大模型发展趋势上,美国的谷歌和open AI等机构是领先的技术方向。欧洲、俄罗斯、以色列等国家和地区都有多个团队和技术人员致力于大模型的最新开发方向。从全球已发布的认知大模型中,美国和中国占据了大头,超过了80%,美国模型数量位居全球之首。自2020年开始,中国大模型进入快速发展期,整体增长态势与美国保持同步,从2017年发布人工智能发展规划以来,各领域的布局为大模型发展奠定了非常好的基础。

政产学研协力合作使中国大模型已经呈现出良好发展态势,无论是理论方法还是软硬件技术的体系化研究能力,都已形成了技术迭代趋势。近年来,中国大模型各种技术路线都在并行突破,特别是自然语言理解、机器视觉和多模态方面,出现了盘古、悟道、文心一言、通义千问、星火认知等多个在行业具有影响力的大模型。同时,我们可以看到中国大模型在地域、领域以及研发主体方面,呈现出明显的发展趋势。

赵志耕表示,据不完全统计,目前中国已发布79个大模型,“我们注意到地域分布明显特点,14个省市地区都有大模型研究,但北京和广东非常突出。北京有38个大模型,广东有20个大模型。在模型领域分布上,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域。计算机视觉和智能语音等领域仍有待进一步突破,目前模型较少。”

大模型快速发展但合作开发力量不足 北上广AI论文数量最多

“研发主体分布上,大学及研究机构和企业都投入大模型研发,但单独研究现象较多。产业界和学术界合作开发的力量不足。今年以来,大模型呈现快速发展的态势,我们观察到合作收缩趋势,这是接下来需要注意的。”赵志耕说。

在她看来,算力是重要的要素资源,对人工智能发展很重要。同时,人工智能大模型与算力之间存在强相关性和正相关性,“我们注意到北京、广东、浙江、上海等地的大型模型数量众多,但近3年来,我们发现同样的现象,这4个地区的人工智能服务器采购数量非常巨大。因此,各地在加快公共算力部署推动人工智能发展的同时,也加速了大型模型基础设施的建设。”

剑三怎么发布团队告示_复旦团队发布首个类chatgpt模型_复旦类脑研究院怎么样

赵志耕表示,人才是人工智能的重要支撑。在大型模型发展上,人才呈正相关关系。例如,北京、江苏、广东和上海等地的大型模型人才相对集中,同时也是人工智能人才的高地。从区域影响力来看,北京、广东、上海三地在论文的发表量和引用量上居国内最高。其中清华大学和阿里、百度联合开发的模型论文引用数量最高,华为的FILP、百度的ERNIE 3.0以及阿里的M6-OFA引用数在国内也名列前茅。然而,这些大模型的学术影响与国际相比仍有一定差距。

强调开源开放 国内超半数大模型实现开源

赵志耕表示,在人工智能发展方面,中国强调开源开放这一基本原则,大多数人工智能大模型的发展也坚持开源创新和生态引导。目前,超过一半国内发布的大模型已经实现了开源,其中开源的主力是高校和科研机构,如清华大学的-68、复旦大学的MOSS以及百度的文心系列大模型。

“目前,中国大模型的产业化应用沿着两条技术路线发展,第一条路线是通用类大模型,正不断打造跨行业的通用化人工智能能力平台,其行业应用正在从办公、生活、娱乐等方向向医疗、工业、教育等领域加速拓展。另一条路线是针对垂直领域的专业类大模型,有大批针对生物制药、遥感、气象等垂直领域的专业大模型,正发挥其在领域内的纵深应用效果。同时,我们也看到许多企业提供针对特定业务场景的高质量专业化解决方案,不断扩大大模型产业化应用的市场空间和水平。”赵志耕说。

赵志耕也对国内大模型的发展提出了建议,她表示,要加强资源和研发力量的统筹,促进大模型的有序发展;加快基础研究和技术创新,提升学术和开源影响力;强化大模型发展中的场景牵引作用,打造大模型标杆项目;强化国际合作,积极参与全球人工智能治理。

“中国在人工智能健康可持续发展方面一直秉承高技术和向善发展,以人为本的理念,我们推出了人工智能的自律原则和伦理规范。我们希望这些治理原则和伦理规范能够在大模型的全链条中落地生根。在增进共识的基础上,加强人工治理的全球合作,创造中国的智慧和治理方案。”赵志耕说。

记者联系邮箱:

新京报贝壳财经记者 罗亦丹

编辑 宋钰婷

校对 王心