Bard和之间最大的区别在于,在撰写本文时,Bard知道,但却不知道Bard。但是我可以玩,而 Bard对我们大多数人来说仍然遥不可及。

推荐:使用NSDT场景编辑器助你快速搭建可二次编辑的3D应用场景 与 Bard之战的开始

和 Bard都是AI聊天机器人。这项技术的最简单版本已经存在于您的智能手机上 – 您键入“好”,您的手机预测您可能想要使用的下一个单词是“早晨”。

最初由开发,然后由投资,达到令人瞠目结舌的10亿美元(除了早期的1亿美元投资)。谷歌对他们的搜索垄断可能已经结束感到有些恐慌,作为回应,他们推出了Bard,他们的技术版本有一些缺陷。在第一次现场演示中,Bard犯了几个事实错误。至少可以说,谷歌很尴尬。

和 Bard比智能手机预测文本复杂一些,但要了解两个AI聊天机器人之间的差异,这就是你需要知道的。

让我们更深入地了解这两个AI引擎之间的技术差异。

AI与Bard之间的对决:底层技术是什么??

您可以在这里快速、轻松地了解两种引擎之间的技术差异。正是如此。如果您想要更细致的外观,请随时进一步滚动。

查特

Bard

GPT-3.5

LaMDA,或对话应用程序的语言模型

神经网络架构

变压器

变压器

训练数据

Web 文本,主要是一个名为“常见抓取”的数据集,将于 2021 年年中截止

1万字的公共对话数据和网络文本

目的

成为通用的文本生成聊天机器人

专门用于帮助辅助搜索

参数

175 亿个参数

137 亿个参数

造物主

开放人工智能

谷歌

优势

– 现在向所有人开放

– 更灵活,能够使用开放式文本

– 训练数据在 2021 年截止

– 训练数据到现在

– 专门针对对话进行训练,因此当您使用它说话时听起来更人性化

弱点

– 对话没有那么令人信服

– 没有仔细微调

– 目前不可用

– 可能不太适合一般文本创建

现在您已经有了 TL;DR,让我们更深入地了解所有这些指标。

什么是?

于 30 年 2022 月 4 日突然出现。到 2022 年 2023 月 100 日,该服务的每日用户已超过 万。 年 月,这一数字激增至 亿多用户。

它立即流行起来的基本原因是它可以以一种听起来几乎人性化的方式为您提供许多主题的可靠回复,并且任何有互联网连接的人都可以访问它。

谷歌文档怎么导出word_谷歌文档里的chatgpt怎么用_谷歌文档app

由创建,是一家位于旧金山的AI实验室,专注于创建友好的AI。聊天机器人位于 GPT-3.5 上,这是一个大型语言模型,当给定文本时,可以继续提示。

除此之外, 还得到了一些额外的培训——人类培训师通过与模型交互来改进模型,并“奖励”模型以获得更高质量的答案。

训练数据

GPT-3.5 是在一个巨大的网络文本数据集上进行训练的,其中包括一个名为 Crawl 的流行数据集。常见爬网包含 PB 级的 Web 数据,其中包含原始网页数据、元数据提取和文本提取。例如,它包括来自的我们自己的URL集合。认为 是使用我们每天访问的网站进行训练是不是很疯狂?

Crawl 负责 60% 的训练数据,但 GPT-3.5 也从其他来源获取数据。

什么是 Bard?

Bard是对受欢迎的回应。与不同,Bard由自己的模型LaMDA提供支持,LaMDA是对话应用程序语言模型的缩写。与 不同,它并不那么令人兴奋,原因很简单,大多数人还无法访问它。尽管谷歌确实在二月初举办了一个充满错误的Bard演示,但现在它只提供给少数人。

谷歌的Bard的主要优势是它对互联网开放。问总统是谁,它不知道。这是因为训练数据在 2021 年年中左右被切断。与此同时,Bard今天利用互联网上的信息。问问Bard,理论上,Bard应该能够从今天互联网上可用的数据中提取出来,告诉你总统是谁。

虽然你还不能试一试,但很容易看出Bard如何在几个关键方面从 中脱颖而出。

训练数据

首先,LaMDA接受了对话训练,专门用于在对话中交谈,而不仅仅是像GPT-n模型那样生成文本。虽然 毫不掩饰其训练数据,但我们对 Bard 接受训练的数据知之甚少。

我们可以通过查看LaMDA的研究论文来推断一下。谷歌的研究人员表示,12.5%的训练数据来自 Crawl,就像GPT-n模型一样。另外12.5%来自维基百科。根据研究论文,他们使用了1.56万亿字的“公共对话数据和网络文本”。

以下是完整的细分:

12.5% 基于 C4 的数据(常见爬网数据的派生数据)

12.5% 英语维基百科

12.5%的代码文档来自编程问答网站、教程等

6.25% 英文网页文档

6.25% 非英文网页文档

50% 对话数据来自公共论坛

我们知道常见的抓取数据,显然你知道维基百科。其余的呢?它是故意隐藏的,大概是为了保护Bard(和LaMDA)免受模仿者的侵害。

LaMDA是通过微调一系列基于的神经语言模型而构建的,这些模型是最初由开发的开源神经网络架构。(有趣的旁注 – GPT 也是建立在变形金刚之上的。

有一些护栏来防止它变得太讨厌或胡说八道,但谷歌已经强调了他们如何精心创建质量保证,使Bard成为更好,更安全的聊天机器人。Bard经过微调,以促进“质量、接地气和安全”。

谷歌对此有很多话要说,我建议阅读他们关于它的博客文章,但如果你时间紧迫,它基本上可以分解为:

由于发布错误,我们已经知道谷歌还没有完全弄清楚这个最低要求。但值得注意的是,谷歌以一种没有的方式如此清楚地谈论这些设计要求 – 至少现在还没有。

vs 谷歌Bard:模型参数,为什么它很重要?

确实比 Bard 拥有更多的模型参数 – 175 亿对 137 亿。您可以将参数视为旋钮或杠杆,模型会调整这些旋钮或杠杆以适应正在训练的数据。更多的参数通常意味着模型具有更大的能力来捕获语言中的复杂关系,但它也存在过度拟合的风险。

Bard可能不太灵活,但与相比,它对新语言用例的鲁棒性也可能更强。

vs Bard:他们有什么共同点?

值得强调的是,Bard和都位于基于的深度学习神经网络上的模型(分别为LaMDA和GPT-3.5)。

例如,可以制作一个经过训练来阅读句子或段落的模型,注意这些单词之间的关系,然后预测它认为接下来会出现什么单词 – 类似于智能手机的预测文本,正如我之前提到的。

我不会在这里深入讨论杂草,但你需要知道的是,这意味着在他们的核心,Bard和 彼此之间并没有太大的不同。

vs 谷歌Bard:所有权

虽然所有权并不完全是技术差异,但值得牢记。

Bard由全资制作和拥有,位于LaMDA之上,LaMDA也是由创建的。

由位于旧金山的AI研究实验室开发。 最初是非营利性的,但它确实在 2019 年创建了一个营利性子公司。也是Dall-E的幕后推手,Dall-E是你可能玩过的AI文本到图像生成。

虽然在上投入了大量资金,但目前它是一家独立的研究机构。

哪个是最好的,和谷歌Bard?

很难对这个问题给出一个公平的答案,因为它们是如此相似,但又如此不同。首先,现在几乎没有人可以访问 Bard。另一方面,的训练数据在大约两年前就被切断了。

两者都是文本生成器 – 您提供提示, Bard 和 都可以回答它。两者都有数十亿个参数来微调模型。两者都有重叠的训练数据源,并且都建立在 (相同的神经网络模型)上。

它们也是为不同的目的而设计的。Bard将帮助您浏览谷歌搜索。它被设计为对话式的。可以生成整个博客文章。它旨在吐出有意义的文本块。

最终,和 Bard之间的技术差异只是强调了AI驱动的文本生成技术已经走了多远。虽然它们都有很长的路要走,并且在版权和道德方面都面临争议,但这两个生成器都是现代人工智能模型的有力演示。

原文链接: vs Bard:技术差异的比较 ()