开放注册两个月用户数破亿,火爆的背后是人工智能算法、算力和数据的再一次融合升级。现象级的带动人工智能第三次浪潮的再次飞跃和各国、各企业的AI竞赛。在人工智能领域,全球目前尚未形成绝对主导的技术依赖和产业生态,我国的新型举国体制如能发挥更大的作用,将给AI的发展提供极为有力的支持。中国人工智能从0到1的技术突破需要沉下心来长期深耕、从1到100的商业化则需要完整的产业生态和市场化企业低成本的商业破局。

透视

爆火的

成为用户破亿速度最快的消费级应用。2022年11月30日上线,5天后用户数超百万,2023年1月月活用户过亿。从某种程度上看,与聊天就像与真人聊天,“他”上知天文、下晓地理,对答如流,明显区别于其他人工智能客服机器人,流畅的对话之外,还能写论文、写歌曲、写剧本、写小说,编代码、修复代码 bug、翻译、绘画等。

引来全社会的普遍关注。科技部近期发文强调将把人工智能作为战略性新兴产业和新增长引擎,继续给予大力支持;国内外各大科技公司迅速跟进,也都对外公布相关布局;甚至有人开始担忧对人工的替代,讨论引发的十大职业危机;也有用户抨击对于很多问题的回答,往往是一本正经地胡说八道。

何为

是由人工智能实验室所开发的软件应用,是一款能够模仿人类进行智能对话的聊天机器人。Chat与GPT( Pre- ,生成预训练转换器)的结合表示是以GPT为基础的聊天机器人。官网称是基于GPT-3.5架构的大型语言模型(LLM)。并非由单一技术产生,是多种深度学习技术(、自监督学习、微调、人类反馈强化学习RLHF、AI对齐等)叠加在一起形成质变的产物。

成立于2015年,专注于通用人工智能的研发。2018年,提出GPT模型的概念,团队开发GPT-1,随后该模型演变为GPT-2, 2020年又推出GPT-3,相比前两代性能更加强大,使用45TB的文本数据进行训练,参数超1750亿个。GPT-3.5是GPT-3微调优化后的版本,更加强大。

的核心壁垒

大模型。GPT大模型是的基础,经过多个版本迭代,GPT-3版本参数量达1750亿,参数数量高于GPT-3。AI大模型( Model,基础模型)指通过在大规模宽泛(标记和未标记)的数据上进行训练后,通过将知识存储到大量的参数中并对下游任务进行微调,能适应一系列下游任务的模型。目前100亿参数以上的模型称为大模型。

大数据。训练数据集规模巨大,训练数据集包含六类数据,分别是维基百科、书籍、期刊、链接、 Craw以及专门的数据集。GPT-3的预训练数据有45TB。训练数据集规模未公开,推测也是百T级别。

大算力。GPT-3的算力需求为/s-day(假设每秒计算1千万亿次,需要3640天),微软投入5亿美元建设了超算中心专为GPT-3训练。业内人士认为1万块 A100 GPU是AI大模型的算力门槛。

大投入。大模型、大数据和大算力带来极高的训练成本、运营成本等投入。GPT-3训练使用了上万块 V100 GPU和28.5万个CPU,一次训练的成本为近千万美元,训练时长达14.8天,的训练成本或比GPT-3更高。的运营成本高,每次调用 聊天的成本为几美分,远高于传统搜索。

人工智能的发展趋势

算力成为制约AI发展的最关键因素对算力的极致追求使大模型以及未来的人工智能成为寡头之间的竞争,算力低位的国家以及企业会逐渐失去对人工智能技术的话语权,而算力领先将造就头部国家以及企业发展人工智能的基础壁垒。2020年,微软为建设的专门用来训练GPT-3大模型的超级计算集群算力为/s-day,算力建设成本为7500万美元,云端训练的单次训练成本近千万美元。发布的AI模型算力报告中指出,2012年起,基于GPU集群的超大规模深度学习模型高速发展,AI训练的算力呈指数级增长,每3.4个月翻一番。从2012年到2020年,AI算力增长超600万倍,预计从2023年到2028年,AI所需算力再增加100万倍。

&中泰证券1985-2025E全球算力需求

算力的寡头化可能带来通用人工智能的寡头化

中国的人工智能与chatgpt的差距_中国人工智能算法差距_人工智能中美差距

算力成为继电力之后新时代的核心生产力,也是数字经济的核心生产力,全球主要国家都在投入巨资,加快算力布局,算力成为大国战略竞争的新焦点。算力时代,谁掌握先进的算力谁就掌握发展的主动权。IDC报告显示,算力规模与经济发展水平呈现显著的正相关关系,算力规模越大,经济发展水平越高。算力将成为决定GDP发展的最核心因素,GDP领跑国家强大的算力将领先追赶者和起步者,呈现全球算力寡头化趋势。高端AI芯片是算力的组成关键。美国政府2021年8月将英伟达、AMD两家企业的GPU产品列入贸易限制范围,国内现有A100储备均是存货。

算力的寡头化将带来以为代表的通用人工智能( ,AGI)的寡头化。IDC全球算力指数报告指出,美国和中国算力排名前二,处于领跑者阵营,其余国家为追赶者、起步者阵营。近年全球各国间的算力竞争在加剧,大多数国家算力均有提升。各国家所属阵营较上一年未变化,一定程度上反映出全球各国算力竞争格局已初步形成。起步者阵营和追赶者阵营国家算力差距在缩小,而领跑者阵营与追赶者阵营、起步者阵营的差距在拉大。

年-2022年全球计算力指数与GDP回归分析

深度学习仍是人工智能发展的主流方向

2006年,在《》上发表论文,提出了深度学习算法,用多层的卷积神经网络实现比机器学习的特征提取更强的特征学习能力,AI进入新发展阶段。深度学习典型算法包括卷积神经网络(CNN)、递归神经网络(RNN)、前馈神经网络(FNN)、生成对抗网络(GAN)等。2017年谷歌提出 算法,此后广泛应用于自然语言处理,并逐步在计算机视觉等领域应用,最近发布的也是以为基础构建的。深度学习仍是人工智能未来发展的主流方向。

多模态融合的大模型是未来人工智能的发展方向

人工智能正在从文本、图片、语音、视频等单模态智能,向着多种模态融合的通用人工智能方向发展。多模态统一建模,目的是增强模型的跨模态语义对齐能力,打通各个模态,使得模型逐步标准化。随着算力、数据和AI技术的发展,多模态融合的大模型将向更深的认知智能方向发展,加速通用人工智能的发展。基于多模态融合的大模型有望成为人工智能的基础设施。

我国人工智能的发展建议

人工智能发展要发挥新型举国体制优势

发展人工智能产业必须发挥新型举国体制优势,用好政府、国家队和市场三方面力量,将有效市场和有为政府有机结合,将自主创新与开放创新协同互动。政府顶层规划推动人工智能长期性、系统性、创新性发展,引导长期投资;国家队在人工智能基础科学领域取得突破,并建设一批关键人工智能基础设施;市场端重视发挥市场力量和产业生态的重要作用,建立以头部人工智能企业为主体的技术创新攻关机制,重视各行业人工智能的产业化规模落地。

充分强化数据、算力和算法的铁三角

算力是基础、数据是养料、算法模型是中枢,三者配合式的闭环循环使人工智能稳定、快速发展。目前,我国数据分散、算法不足、算力薄弱等问题不容忽视。算力是未来人工智能发展的基础,亟待不断强化人工智能算力网络基础设施建设,以满足AI大模型及算法等对算力的需求。鼓励相关数据和模型的资源共享已经成为美、英、日、韩等国家在AI管理上的重要共识,我国在加强数据保护的基础上,要充分利用大数据资源,鼓励数据开放共享。

炼大模型并聚焦低成本商业化

“炼大模型”阶段,我国起步稍晚于国外,在这个领域也研究多年,但是如果国外寡头效应愈显(大数据积累、大算力支持和大模型迭代),与国外的差距可能会被拉大。大模型已成行业与场景创新突破的共识,持续不断降低通用或行业大模型的建设、训练和使用成本成为商业化的关键。今年3月,推出API使开发人员集成成本降低为1/10。有别于从0到1不计成本的技术突破,商业化需要我国企业提供性价比更高、成本更低的解决方案以及落地能力更强的行业大模型。

重视人才培养、AI伦理、安全和法规建设

重视AI人才培养、补齐人才短板,是我国AI发展的当务之急和长期需求。根据相关部门测算,我国人工智能人才缺口超过500万,国内的供求比例为1:10,供需比例严重失衡。刚兴起,伦理和安全问题较少被关注,未来多领域加速应用,将导致相应的伦理和安全问题逐渐凸显,需提早布局,将AI伦理治理融入AI全生命周期,增强数据安全和隐私保护能力。政府要根据AI在各应用领域的落地进程及时完善相应行业法律法规,让新业态有法可依、有规可循。

搭建产业生态并密切跟踪全球发展趋势

无论是PC时代的体系(微软+Intel),还是移动时代的AA体系(ARM+),美国都打造了完整的产业生态来把控产业的主导权和实现行业的垄断。人工智能领域目前尚未形成绝对主导的技术依赖和产业生态,我国应加快产学研用联合攻关,搭建自主“AI芯片+框架软件+大模型+产业应用”的人工智能生态体系。同时,也要持续密切跟踪AI领域全球前沿技术发展趋势,掌握发达国家在研发、支持、监管等方面的最新动态,并结合我国国情学习借鉴。

作者单位:中国信息通信研究院产业与规划研究所