AI神器火了。
能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住,它就是刚刚推出的——。
有脑洞大开的网友甚至用它来设计游戏:先用生成游戏设定,再用出图,简直是AI生产力一条龙了。
有人还将的回复与谷歌搜索结果对比,惊讶地发现在实用性上强太多:谷歌这是要凉啊。
甚至有人预言如果谷歌不做出改变很快就会被淘汰,到时候自己愿意每月花15-20美元使用。
不过好消息是,目前正处于免费试用阶段,有条件的小伙伴可以赶紧试试。(链接放在文末)
有多厉害?
有网友分别问谷歌和“如何使用Latex表示微分结果”,相较于谷歌中规中矩的回答:
则是一下给出了直接可用的代码,你只需动动手复制粘贴即可:
还有人让给出冒泡排序的最坏时间复杂度,并且要求它用“19世纪40年代黑帮电影中讲话很快的聪明人”口吻说出来,也被轻松拿捏:
直接问下面代码的bug是啥,也能给你说得明明白白:
除了计算机,在其他领域表现也很出色,比如它还能AI在线问诊。
当你告诉它自己得了皮疹,并且呼吸困难,感觉很虚弱时,会像医生一样为你分析病因,并建议你比起吃药,更需要戒烟、多锻炼。
与搜索引擎里需要小心分辨的医疗广告对比,可以说很贴心了。
背后原理
顾名思义,是在GPT-3.5系列中的一个模型上进行微调而成,该系列已在2022年初完成了训练。
它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。
与今年初发布的一样,也是使用强化学习进行训练,但在数据收集设置上有所区别。
在模型训练中,使用监督微调:训练者提供对话样本,扮演对话的双方,即用户和AI助手。
除此之外,训练者还可以访问模型编写的建议,帮助他们撰写答案。
为了创建强化学习的奖励模型,研究团队需要收集比较数据,为此,他们随机选择模型编写的信息,对替代结果进行抽样,再让训练者对样本进行排名。
通过上述的奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代,最后得出了该模型。
不过别看它在许多方面表现都很出色,研究人员也承认现阶段还存在一些bug。
举个例子,有网友在多次尝试后就指出,经常会过度使用某些短语,比如反复重申“自己是由训练的语言模型”。
除此之外,有时候的回答过于冗长,甚至当网友告诉它自己需要更短一点的回答时,它反而说的更多了。
还有理性的网友指出,想要替代谷歌也没那么容易。
一位在工作的网友就现身说法,谷歌也不是没有考虑过在搜索引擎中引用大模型,但最大的问题是成本太高了。
如果要对用户收费的话,价格很可能高达150~200美元每月,恐怕没有几个人愿意支付这笔钱。
不过,的CEO萨姆·阿尔特曼(Sam )对的未来发展表示很有信心:
他表示,语言接口将是未来的一个发展方向,而就是为大家先打了个样,相信很快大家就能用上能跟自己聊天、回答问题并提供建议的AI助手了。
话说回来,你还想到了哪些好玩的用途?
发表回复