AI神器火了。

能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住,它就是刚刚推出的——。

有脑洞大开的网友甚至用它来设计游戏:先用生成游戏设定,再用出图,简直是AI生产力一条龙了。

有人还将的回复与谷歌搜索结果对比,惊讶地发现在实用性上强太多:谷歌这是要凉啊。

甚至有人预言如果谷歌不做出改变很快就会被淘汰,到时候自己愿意每月花15-20美元使用。

不过好消息是,目前正处于免费试用阶段,有条件的小伙伴可以赶紧试试。(链接放在文末)

有多厉害?

有网友分别问谷歌和“如何使用Latex表示微分结果”,相较于谷歌中规中矩的回答:

则是一下给出了直接可用的代码,你只需动动手复制粘贴即可:

还有人让给出冒泡排序的最坏时间复杂度,并且要求它用“19世纪40年代黑帮电影中讲话很快的聪明人”口吻说出来,也被轻松拿捏:

直接问下面代码的bug是啥,也能给你说得明明白白:

除了计算机,在其他领域表现也很出色,比如它还能AI在线问诊。

当你告诉它自己得了皮疹,并且呼吸困难,感觉很虚弱时,会像医生一样为你分析病因,并建议你比起吃药,更需要戒烟、多锻炼。

与搜索引擎里需要小心分辨的医疗广告对比,可以说很贴心了。

文章分析怎么分析_文章分析器_如何用chatgpt来分析pdf文章

背后原理

顾名思义,是在GPT-3.5系列中的一个模型上进行微调而成,该系列已在2022年初完成了训练。

它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。

与今年初发布的一样,也是使用强化学习进行训练,但在数据收集设置上有所区别。

在模型训练中,使用监督微调:训练者提供对话样本,扮演对话的双方,即用户和AI助手。

除此之外,训练者还可以访问模型编写的建议,帮助他们撰写答案。

为了创建强化学习的奖励模型,研究团队需要收集比较数据,为此,他们随机选择模型编写的信息,对替代结果进行抽样,再让训练者对样本进行排名。

通过上述的奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代,最后得出了该模型。

不过别看它在许多方面表现都很出色,研究人员也承认现阶段还存在一些bug。

举个例子,有网友在多次尝试后就指出,经常会过度使用某些短语,比如反复重申“自己是由训练的语言模型”。

除此之外,有时候的回答过于冗长,甚至当网友告诉它自己需要更短一点的回答时,它反而说的更多了。

还有理性的网友指出,想要替代谷歌也没那么容易。

一位在工作的网友就现身说法,谷歌也不是没有考虑过在搜索引擎中引用大模型,但最大的问题是成本太高了。

如果要对用户收费的话,价格很可能高达150~200美元每月,恐怕没有几个人愿意支付这笔钱。

不过,的CEO萨姆·阿尔特曼(Sam )对的未来发展表示很有信心:

他表示,语言接口将是未来的一个发展方向,而就是为大家先打了个样,相信很快大家就能用上能跟自己聊天、回答问题并提供建议的AI助手了。

话说回来,你还想到了哪些好玩的用途?