直到我高中伙伴都在微信上问我,最近那个”跟你们那个小秘书很像啊,你们在哪里吖,给我玩玩“。我才发现,出圈的有点出乎意料了,除了、 LaMDA、的[链接1]也都是不错的大模型算法驱动的问答机器人,
其实我们阅粒知识计算引擎也有问答机器人这个方向的应用,于是也决定来凑凑热闹,也聊聊生成式算法驱动的问答,对话式信息消费,对围绕这个消费体验的信息知识生产,以及关键技术,及阅粒在干啥。
这四个主题都太大,只能围绕”知识信息服务大众化,信息消费体验和生态”这个核心逻辑来浅薄地谈谈。
先谈观点,再展开:
1,对话式UI可能走向更广更深的应用,
人和软件的互动将变得更有趣、更拟人。
2,信息消费代理化,
会有root bot和你自己的个性化bot一起为你的知识信息消费负责
3,知识信息生态发生变革,
利益分配机制、生产方式以及对生产者价值的肯定会进行正循环激励
4,阅粒知识计算引擎在干啥
是广告,也是汇报,让生成类算法的惊艳变的无需解释。
第一点:意图理解新篇章,对话式CUI获得极大提升
意图理解,故名思议,就是理解人的表达、需求、以及期待,软件如何理解人,UI如何更低门槛更好用,这是人工智能领域中的重要方向,把自然语言输入(例如文本或语音)转换为计算机可以理解的形式,以便对用户的请求进行处理,它通常包括语言分析、词汇分析和语法分析等技术,以确定用户的请求的意图。让计算机系统理解人类的意图和语言语义,用于触发相应的信息输出或者软件互操作,以完成对预期问题的解决。
从小冰、siri、小度、小爱这些手机里的问答机器人使用体验来看,效果都差强人意。主要就是针对语音语义的处理的各种环节都有一定概率的效果损失,比如语音识别对有口音的输入效果,对信息消费类复杂表达的更是经常丢关键输入约束信息,甚至对于需要推理判断的,复杂问题,同时多个问题的,这些问题用大模型生成类算法自动修正,有一定概率能解决到较好的程度。
这个在实现上,是可以通过一个模型,对多种语言文化,机器可以跟人,在用人的语言、文化、逻辑和思考提问来互动问答交流信息了。对文本输入“意图的理解”达到了一个新高度,上次引领这个人机交互新方式的还是“推荐引擎”。
对话即界面,以互动问答的方式进行信息消费、这个产品体验进化的一个重要分支趋势,从个人体验上看,信息消费、知识参考互动问答,不断逼近最匹配的意图,高度拟合现实世界的人与人互动沟通交换信息和获取价值交换。
官网上还介绍了50多种场景具体的方案,这些场景下针对具体应用,可以在输入中提供你希望侧重的信息,来实现对主题交互内容的收敛、生成文本输出的约束。通过合理,即可定制一个相对开放式、信息领域更聚焦的话题,或者topic .
但是这里就有一个问题,他的理解可能是正确的,但是他的训练语料并没有你谈的话题的最新“事实”“观点”等信息,所以他可能回答的东西是逻辑正确的废话。
阅粒知识计算引擎训练语料上层语义分类
目前机器阅读理解技术可以从用户输入中识别出多种意图,常见的意图包括查询,获取信息,确认,评价,比较,提议,指令,请求帮助等。此外,还可以识别更复杂的意图,如情绪分析,情感识别,自然语言理解,语义关系推断等,除了能理解你要问的问题,表示的观点,在情绪的识别上也是达到了相当水准,当他说“对不起”的时候,往往能非常及时纠正跑偏的主题。
虽然大部分觉得像搜索,又觉得不是搜索,从技术演进上来看说一脉相承过分了,但是内在真是一种演进,非常相关,而且新的大模型的技术方法论的大跃进,确实带来了传统统搜索引擎技术实践的路径和方法不同的效果。
总的来说,意图理解的实现方式和效果的巨大提升,是实现人机对话的关键技术,它可以帮助计算机系统更好地理解人类语言,从而提高人机对话的效率。是这个对话引擎载体,所demo出来的能力相当有希望成为新的交互方式技术实践的范例。
第二点:信息消费代理化
将成为很多面向消费者的内容生产助手、素材来源和创意激活器,甚至就是直接创作工具箱。与必应的深度整合,实际上就是 TOC了。会怎么改变和影响传统的信息消费体验,不是探讨加不加分的问题,而是加多少,会不会翻倍。
随着bing查询请求的引入,能激活大量用户query,成为新的的启动,亦如百度知道对百度搜索市场竞争优势的增强,是信息消费体验代理化升级的起点,前景无法预测的灿烂和宏大。
从互联网资讯生产消费的生态来看,内容创造者创作的内容都是通过发行渠道、分发引擎触达消费者的,比如门户时代,传统媒体与门户网站的授权转载,内容有限,信息消费者看到的都是经过网媒编辑筛选和重排的内容。
搜索引擎时期,搜索作为入口收录了各类网站,包括资讯、资源、权威门户、Web2.0社区 ,根据用户搜索关键词分发,当然,也有大量的封闭生态、垂直数据库或者 web[链接2],并未被搜索收录,信息消费者看到的是丰富多样、良莠不齐的内容盛宴,也同时带来了内容消费体验的随时间积累变差。SEO、网络营销等寄生态业务也随着大趋势推波助澜。
推荐驱动的个性化分发时期,Web2.0创作社区、自媒体人在APP生态创作,形成生产分发消费闭环,这个阶段资讯内容严重过剩,每个人看到的都是基于自己偏好的内容的小世界,观点冲突、多样性的不可见问题,都导致网络戾气更多,甚至出现比SEO更夸张的“网军”,他们主动出击主动引导甚至塑造创造一些他们需要的,来实现商业目的。随着内容生产成本的大幅度下降,有意识生产信息、引导舆论和观点“舆情”战逐渐成为产品内容生态重要参与者,这个体验真是一样难尽,既有给你看啥你才知道有啥的坐井观天式自得,也有“无论魏晋只知有汉”局限。
而问答机器人这种通过“拟人化”技术,由程序代理学习理解信息构建知识库,他能自辨是非(信息足够全面,训练语料40TB),自主筛选(选择权威的、流畅的、避免低质量不可靠的,甚至还有算法识别是程序生成的内容也是被剔除的),然后根据个人偏好,在需要的时候,排除不可靠和错误的信息(错误信息包含两层:事实性错误;价值观不正确,比如跟社会主流价值违背、违反道德标准等),对相关信息进行生成展示,这是一种新的机制,生产者变成了供养机器学习的算法工程师,他们筛选、评价、清理、转换,最后形成算法使用的训练语料,而传统的内容生产者,会非常间接地参与到这个信息资讯消费生态。
虽然有这个查询引擎类似的功能。但是更多充当的是,对你输入进行的即时性反馈。你所想知已经被算法和软件,通过标准化训练内化成了编码。
当然,目前类似于等,大语言模型LLM表现出了出色的能力,用几个小提示或文本指令即可驱动解决新任务,特别是在大规模、广范围的情况下。自相矛盾的是,它们也难以实现基本功能,比如算术或某些事实,比如很多人反馈的微观事实错误以及简单算术题问题,更深层次的还有,他的训练语料带来的知识认知偏差、逻辑缺陷等。而有些简单得多、小得多的模型在这些方面却表现出色。
这个信息消费代理化机制,与这种对话人机交互形态技术的人格化一样,获得高度信任、并成为亲密伙伴,将发挥巨大价值,运营商也能获得充足的商业收益,保障这一体验和能力随需进化,但是如何商业化,以目前定价20美元toD的模式,显然看起来是不够的,能看到的是,他们将是微软云最佳销售伙伴。
第三点:知识计算生态将发生变革
在这种新的信息技术服务面向消费者的生态里,生产力的提升如此显著,以至于角色和利益比此前的更复杂。
原来资讯内容生态的内容生产者,自己看书、读报、自己学习、感知生活体验,进而创作知识资讯和信息内容。
内容生产者,消费者,广告主和分发平台(连接器)这种利益驱动关系,分发平台分配部分利益给内容生产者,广告主给分发平台、内容生产者付费,消费者免费使用内容,给分发平台广告点点赞赚广告主的钱,广告主则是是通过销售自己的产品赚钱来驱动整个机制的运转。这是个标准模式的故事线。
这种利益分配机制是驱动这种算法技术生态持续发展的关键,合理的利益分配将促使该系统跟强大、更普世。
新的故事线里,生产关系变成了,在任何入口任何场景下消费者直接消费信息,入口各种形态存在,就是10多年前跟一个搜索大佬探讨过的问题,搜索引擎的10条变3条变1条的问题,能不能在1条反馈上信息消费者预期解决的问题。的demo告诉我们可以。
理论上这种形态不是统一入口了,API才是,通过算法API提供后端支撑,每个入口自己定义商业模式和利益分配机制。在商业模式的逻辑上是一种ToD,面向场景化功能体验创新的开发者的商业模式,D付费自然是理所当然,但是D能不能赚钱则是这套信息技术经济生态价值生产和利益分配问题。
资讯内容的生产者生产的内容,参与的,通过这个交互和反馈,获得创意、灵感和生产创作素材,既可以通过传统的生态变现,又可以直接成为新的算法训练素材。
这些信息和资讯如何辅助价值创造者实现体验创造,进而创造新的价值交换体系,这个是未知而且值得探索的。从2020年疫情远程办公以来,一直跟踪一个叫创作者经济的主题,里边很多体验和价值创造都是非规模化的,而这类的技术是不是可以让其中的大部分规模化和标准化起来,是值得期待的一个方向,同样也是揭示了另一个面相,就是似乎都还是媒体化商业生态的逻辑。
而面向产出结果的评价、的技能需求,毫无疑问是一个新增的角色和话题。这里所说的是非技术性评价。在技术性评价,与搜索引擎自动化评价NDCG、P@k评价不同,生成引擎跟注重F1、BLUE、Rouge这些输出跟输入语义的相关性、本身作为语言输出的流畅和语义逻辑的通顺。
而这种生商业又无法像传统搜索引门户化,通过广告营销生意来规模化。面向价值获益者收费,这个应该是合理,但挺难实践的路径,作为从业者,阅粒知识计算引擎的团队,也一直在尝试。
第四点:阅粒在干啥
很顺利地引入广告环节,说到了我们的产品,阅粒知识计算引擎( yueli.ai),我们也是一个GPT端到端知识计算模型,就是自动化阅读理解到自动化生成,目前在提供领域解决方案,其中智能知识管理、数据智能化方案有多个实际场景在用,在帮助我们的客户解决问题、提升体验,感谢合作伙伴们!
目前状态是:
(1)base在阅粒知识计算模型、支持端到端理解和生成,支持上层NLP API、NLG API应用或者我们提供的解决方案应用。
(2)2020年优化大部分工程自动化模块,以及在提供自动化知识图谱、数据智能化解决方案。
其中智能知识管理系统,提供个人或者企业级知识问答解决方案。c端产品有一些少量用户一直在用,(2020年7月份因为内容审核的风险关闭注册),其目标是个性化的智能知识助理。
(3)我们提供智能知识管理解决方案私有化SaaS服务,也提供模型私有化部署,针对数据微调训练增强效果领域反馈的优化。目前以私有化部署为主,跟华为云、阿里云、腾讯云都有战略合作,也支持客户私有云部署。
欢迎有合作需求的老板看过来,这句是重点。
再补充一下因由始末,了解一下我们故事线可能有趣的事儿:
2018年11月, BERT项目和论文发布,作为一个从业者,我被启发了,因此追溯线索,学习了“- Is All You Need”,了解了GPT,了解了。进行了小范围数据集的GPT算法实验,验证了想法。
于是2019年1月份正式启动阅粒知识计算引擎研发,4月份初步效果获得,开始同步建设数据中台、算法运营和效果评价系统、数据集管理等。2019年6月份,开始接入对外调用试验,拿到随机1000新闻内容,跟国内某头部大厂传统NLP驱动的AI云做过效果对比,七七八八不相上下,支持中英文,每天200多万算法调用请求。
2019年训练的时候,深刻的印象是,行政的小姐姐每周都催我充电费,一次5000块电费,几天就没。
至今,我们对生成类算法研发与市场化GTM上获得几个关键的市场反馈:
(1)toC技术成熟度不够,不能带来颠覆性体验。也有这类问题。
(2)toB市场不太了解这种技术,培育市场需要时间,toB解决方案溢价能力太弱,不足以支撑算法研发的成本。
而且,传统NLP大部分人觉得是忽悠,甚至有某大厂搜索领域大咖,10多年从业经验的人,到我们办公室看着演示屏幕,也非得说是人工运营标注数据结果,而不是算法生成。不了解,自然就没信任,缺乏信任自然就难获得市场交易权利。在这点上了破圈给行业带来了希望。
(3)按照阅粒知识计算模型训练和服务部署的算力,定价出售算法API SaaS服务,把算法作为云计算算力售卖的溢价,可见的未来这种溢价是远不能支撑算法训练进化的需求,更别说投资人的利益增值和变现。
(4)作为一个商业,我们一直坚持提供价值,参与市场交易和价值交换,但是这作为一种前瞻性技术应用,尤其是前瞻性技术探索,创业公司在获得资本市场、交易市场上的认可,还在努力中。不是我们没有理想,是我们需要跑的更远。
生成类算法,能做的主要市场化商业化的路径我们都有过低成本尝试和验证,比如营销文案、比如短视频生成等,亦如陆奇的反馈,你这个“GTM很难”,这就是创新的代价吧。
我们希望成为生成式算法应用的领先者,初心未改,我们在路上坚持向前。
对了补充一下,我的公众号上发的哈斯日志AI及信息技术应用简报,就是我们阅粒简报和搜索辅助生成的,关注领域技术应用的最新进展的朋友可以持续跟踪。
链接1:
链接2:
:35:00%2B08:00&max-=10&m=1
发表回复