是美国研究人工智能的公司于2022年11月30日发布的通用聊天机器人程序。推出之后,在2个月内达到1亿活跃用户,是历史上增长最快的消费者应用程序,受到全世界的广泛关注,掀起了人工智能领域的技术巨浪。分析的相关技术特点,研究在市场监管领域应用的优势和存在的问题,对于做好新时期的智慧监管工作具有重要的意义。
一、概述
作为由人工智能技术驱动的自然语言处理工具,能够通过理解和学习人类的语言来进行对话,根据用户的文本输入和聊天的上下文内容,产生相应的智能回答,像人类一样来聊天交流,还可以完成编写代码、设计文案、撰写论文、机器翻译、回复邮件等多种任务。
具有令人惊艳的语言理解、生成和知识推理能力,能够很好地理解用户意图,真正做到多轮沟通,并且回答内容完整、重点清晰、有概括、有逻辑、有条理。是继数据库和搜索引擎之后全新一代的知识表示和调用方式。
在推出之后迅速形成了一种现象级的应用,表现出很高的人机交互水平,已经具备面向通用人工智能的特征,在众多行业领域具有广泛的应用潜力。
二、相关技术与发展
(一)的相关技术。
Chat GPT的模型架构。 采用基于 模型架构实现的,是一个利用注意力机制来提高模型训练速度的大语言模型。包括了多层自注意力机制和前向神经网络,能够捕捉长距离的依赖关系,具有较强的语言理解能力。
的学习机制。通过大规模语料库的有监督学习来训练的,利用互联网上的海量文本数据进行预训练,从而学习到丰富的语言知识和规律。大规模语料库训练的优势在于可以利用大量的文本数据,从而提高模型的泛化能力、准确率和覆盖率。此外,大规模语料库训练还可以提高模型的鲁棒性,使得模型能够更好地应对各种复杂的自然语言处理任务。
的训练方法。在训练的过程中使用了“人类反馈强化学习”的训练方法,这种方法在AI训练的过程中使用人类反馈,以最大限度地减少无意义的、失真的或者存在偏见的输出。得益于这种训练方法,能够在对话过程中记忆先前使用者的对话讯息,即上下文理解,以回答某些假设性的问题。可实现连续对话,极大地提升了对话交互模式下的用户体验。
(二)的技术发展。
采用的大语言模型规模庞大,包含数十亿的参数,来学习语言数据中的复杂模式。2018年推出的第一代GPT-1模型具有1.17亿个参数,2019年推出第二代GPT-2模型已经具有15亿个参数,2020年推出的GPT-3模型具有1750亿个参数,在GPT-3模型面前,用户提供小样本的提示语或直接询问,就能获得符合要求的高质量答案。2022年3月,推出了模型,该模型为GPT-3的微调版。2022年11月30日,推出全新的对话式通用人工智能工具——。表现出了非常惊艳的语言理解、生成、知识推理能力,可以很好地理解用户意图,做到有效的多轮沟通,并且回答内容完整、重点清晰、有概括、有逻辑、有条理。
2023年3月15日,发布了最新的人工智能语言模型GPT-4,这是一项具有里程碑意义的技术进步。GPT-4不仅可以生成类似于人类语言的文本,还可以接受图像和文本作为输入,并输出文本。GPT-4可以处理多种类型的信息,并以更自然和流畅的方式与人类交流。与GPT-3.5相比,GPT-4拥有更大的模型规模和更多的训练数据,从而提高了其生成文本的质量和多样性。GPT4在语言理解、逻辑推理、数学计算等方面都有很强的能力。除文本输入外,GPT-4还具有处理图像输入的能力,用户可以指定任何视觉或者语言任务。据称,GPT-4在各种专业和学术领域的基准测试中表现出了“人类水平”的性能。3月17日,微软发布 365 ,使用了最新发布的 GPT-4 ,并将其引入到 365 应用程序,包括 Word、Excel、、等,标志着GPT已带来人们与电脑办公软件交互方式的新阶段。
(三)国内类的大模型产品。
随着的GPT系列产品在全球的关注度不断提升,国内致力于人工智能技术研发的机构也先后推出自己的类的大模型技术产品。2023年3月16日,百度正式推出国内首款生成式AI产品“文心一言”,可支持文学创作、文案创作、数理推算、多模态生成等功能。4月10日,商汤科技发布“日日新”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。4月11日的阿里云峰会上,阿里巴巴推出大语言模型“通义千问”,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。4月25日,华为云发布盘古系列超大规模预训练模型,包括30亿参数的全球最大视觉(CV)预训练模型,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言(NLP)预训练模型。2023年5月6日,科大讯飞正式发布讯飞星火认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。科大讯飞将大模型落地应用,推出了面向教育、办公、车载等行业的解决方案。后续国内将会有更多类的大模型产品发布,把国内人工智能技术发展和应用推向新的阶段。
三、技术在市场监管领域的应用
鉴于在语言理解、生成和知识推理方面的出色能力,如果能够将支撑的大模型、学习机制和训练方法等技术应用在市场监管领域,对于优化市场监管部门的服务体验,提升监管效能是一个极大的促进。
(一)市场监管智能客服应用,优化服务体验。
目前,市场监管部门部分业务热线日常电话咨询与投诉访问量比较大,引入相关技术,构建智能客服系统,能够较好缓解投诉咨询服务热线的服务压力,提高用户投诉咨询处理效率,提升监管服务水平。利用在自然语言理解与处理和知识推理方面的技术优势,自动识别用户投诉咨询内容,智能理解用户投诉咨询意图和行为,构建市场监管相关业务知识库,对用户投诉咨询的信息通过语音或文字进行智能化交互与应答,提升市场监管部门对用户投诉咨询的处理效率,提升用户对投诉处理的满意度,提高监管服务水平。同时,对用户投诉咨询的记录进行数据分析,发现用户投诉热点、维权难点和业务咨询集中的领域,使市场监管部门及时掌握投诉维权的“晴雨表”和“风向标”,推动市场监管部门的业务优化与服务能力的不断提升。
(二)市场监管知识库构建,加强智慧赋能。
基于技术,构建市场监管法律法规、监管规则、业务标准、数据标准、技术标准、执法案例等相关知识库,为监管执法人员提供执法规则、执法依据、执法流程、执法案例的智能查询与专题知识服务,规范监管人员执法,提高监管人员执法能力。同时,针对市场主体、社会公众的市场监管相关业务咨询、业务办理,不断丰富市场监管部门与用户的交互方式与渠道,优化用户业务办理体验,推动信息的智能展现,提高用户信息查询、业务咨询、业务办理效率,根据用户偏好提供针对性更强、准确度更高、智能性更强的个性化服务,以知识的智慧赋能,持续提升用户便捷度和满意度。
(三)市场监管风险预警,提升监管效能。
市场监管部门在开展市场监管工作中,产生并汇聚了包括市场主体的准入、监管、执法、维权、经营行为以及市场环境状态发展变化和相关客体的市场监管大数据。利用的大语言模型构建与预训练技术,对市场监管大数据进行处理、分析和训练,能够更加清晰准确呈现市场主体的全景画像,不断优化市场主体信用风险模型和安全风险模型,面向宏观区域行业、中观监管事项、微观主体行为,从个体异动性到群体爆发性再到系统蔓延性的风险扩散态势进行洞察和预警,实现发现的早发现、早提醒和早处置,提高监管的及时性、精准性和有效性。
(四)创新监管方式,推动监管现代化。
市场监管工作中对相关技术的使用势必推动监管工具、监管手段的创新,进一步挖掘市场监管大数据价值,推动市场监管科技赋能,推动市场监管信息化应用系统、平台的功能优化与升级,推动市场监管业务与信息化技术的深度融合,促进市场监管业务的重塑、监管流程的合理再造,支撑市场监管工作的准入、生产、流通、消费等监管环节全过程、全链条的创新,增强监管效能,优化监管成本,推动实现市场监管机制现代化。
四、技术应用中面临的问题
是人工智能技术领域的一项新的突破,作为新的技术在市场监管领域获得应用,还面临数据安全、技术成熟度和资源投入等一些问题。
(一)数据安全问题。
运用技术的应用需要大量数据进行训练,具有收集、储存和使用海量数据的功能。用户在输入端口提出问题后,用户与其对话的数据将会被存储在应用程序运行的云计算平台。人机交互问答中,提问者与分享的数据被用于未来模型的迭代训练,这些数据中可能涉及隐私信息、敏感数据,存在数据泄露的安全风险。就运行在公司的云平台,如果直接使用的,存在数据跨境流动的安全风险。因此,不建议在市场监管应用中直接使用或者调用,在保证数据安全的前提下,可以应用相关的技术。
(二)人机协调问题。
在出现之前,人工智能应用以专用型为主,的出现是通用型人工智能应用的重要里程碑。但是,不能完全代替人,不能过于迷信运用技术由机器给出的结果,也会出现误判,影响市场监管工作的准确性和效果。市场监管应用,必须充分考虑市场监管工作人员的基于自身知识、经验的判断,妥善处理人机协调问题。
(三)技术壁垒与成熟度问题。
并没有向中国大陆用户开放应用,目前国内用户只能通过的镜像网站进行有限的使用体验。之后,国内相关机构先后推出了类似的应用,如百度的“文心一言”、阿里的“通义千问”,科大讯飞的“讯飞星火认知大模型”,商汤科技的“日日新”大模型体系等等,关于技术的成熟度还有待进一步检验。目前的应用主要集中在问答式的应用,由用户提问,计算机给出问题的回答结果。推出以来,还没有看到与政府部门业务相关的成功案例,的应用领域还有待读者去进一步观察和关注。
(四)资源与成本问题。
需要非常大量的算力来支持其训练和部署。目前应用时需要大算力的服务器支持,而这些服务器的成本普通用户是无法承受的,即便数十亿个参数的模型在搜索引擎的部署也需要惊人数量的计算资源才能运行和训练。因此,大多数企业都难以承受这高昂的成本。对于普通大众来说,还需等待更轻量型的模型或更高性价比的算力平台。
五、对市场监管领域应用技术的建议
尽管相关技术在市场监管领域的应用还有待技术的发展和时间的检验,但是及时关注相关技术的发展,针对可能存在的问题进行提前的准备和应对,对于迎接新技术带来的挑战、推动市场监管应用创新和深入做好智慧监管工作有着重要的价值。
(一)加强数据安全管理。
在市场监管领域运用相关技术,必须加强数据安全管理,设立严格的数据权限管理和分类应用制度以保护涉及敏感信息和个人隐私的数据安全。根据市场监管数据的敏感程度进行等级划分和权限管理,以为代表的生成式人工智能模型系统无权获取安全等级高的数据信息,可以向人工智能模型系统开放可以公开的数据。市场监管部门负责监管数据的采集、存储、传输和共享过程,确保数据的应用安全性。除此之外,还应当建立安全性评估制度,定期对运用Chat GPT技术的应用系统进行安全性审查,对照评估指标进行漏洞修补,保障服务数据的安全。
(二)强化风险防控。
面对技术快速发展的浪潮,市场监管部门必须明确,技术的应用是提高工作效率与监管效能的助推器,并不能完全取代人工,市场监管工作者必须不断学习相关技术知识提高自身能力以更好地发挥核心作用,不被技术裹挟。市场监管部门要充分认识相关技术赋能市场监管的作用,对相关技术的风险进行全面审视,强化风险防控意识,客观理性处理评估相关技术应用对市场监管工作的作用与影响,充分发挥人机结合的技术优势,需要针对突发情况建立应急响应预案,进而对出现的技术故障、矛盾和纠纷等问题及时处理,确保公众利益能够得到充分保障。
(三)加强新技术应用创新。
相关技术在复杂度和多样性方面还有很大的提升空间,在解决复杂问题或者理解多重隐含情感时仍然存在一定的缺陷,相关技术应用在政务领域还有相当的距离。但是,的成功也启示我们,在市场监管工作中必须加强新技术应用创新,立足市场监管部门在市场监管信息化建设形成的技术积累和信息资源优势,立足市场监管业务在监管执法工作中形成的制度机制、方式方法、手段工具与案例和经验优势,加强人工智能、大数据等新一代信息技术的应用创新,推动应用系统优化与技术升级,推动监管方式、监管工具、监管手段创新,深入推进智慧监管,不断提升市场监管效能。
(四)加强人才队伍建设。
技术的应用需要用户具备一定的技术和专业知识,建立与新时代市场监管工作和技术应用创新相适应、能够反映工作特性和专业特点的管理体制与运行机制,不断加强熟悉新一代信息技术发展和精通应用的人才培养和引进,在市场监管部门业务人员和信息化工作者中加强技术的培训,推动业务和技术方面的人才交流,培养和建设既熟悉业务又精通技术的专业型人才。
作者 |郑刚
编辑 | 刘琦
审核 | 周山
发表回复