7 月,大模型公司 Cohere 宣布 D 轮融资 5 亿美元,估值 55 亿,比去年高了一倍多。

跟 OpenAI、Anthropic 甚至法国 AI 公司 Mistral 相比,成立于加拿大的 Cohere 略显低调,没有推出自己的 Chatbot、文生图或者文生视频产品,不涉足个人消费端产品;即使是推出的开源大模型 Command R+,似乎也没有那么引人注意。

最引人关注的,可能就是 CEO & 联合创始人 Aidan Gomez,知名论文 Attention is all you need 的作者之一。

27岁,只做toB,估值55亿,不追AGI

跟其他大模型初创公司不同的是,Cohere 聚焦于 ToB 企业市场,客户也来自各种行业,银行、科技公司和零售商,甚至还有奢侈品品牌。今年 3 月底,Cohere 的 ARR 达到 3500 万美元,2023 年底,该数字为 1300 万美元。

Cohere 的业务到底有什么不一样?创始人们对于 Cohere 后续的发展又是如何规划的,他们想走出一条怎样的大模型创业之路?

今天的文章里我们梳理了 Cohere 的核心商业模式业务,以及对于创始人的深度访谈。访谈资料来自 The Verge 以及 CNBC ,Founder Park 略有调整。

01 

不追逐 AGI,专注解决企业落地难题

创始人 Aidan Gomez 出生在加拿大,早年对计算机科学产生浓厚兴趣,并在多伦多大学和牛津大学深造。在完成博士学位之前,他就加入了 Google Brain 团队成为实习生,参与了开发 TensorFlow 模型框架的工作。

2017 年,Gomez 在 Google 实习期间合著了奠定 Transformer 架构基础的论文《Attention Is All You Need》。这篇论文首次提出了一种全新的机器学习架构 —— Transformer。在此之前,大多数 NLP 模型依赖于循环神经网络(RNN)或卷积神经网络(CNN),而 Transformer 的出现彻底改变了游戏规则。

27岁,只做toB,估值55亿,不追AGI

Cohere 联合创始人 Ivan Zhang(左起)、Aidan Gomez 和 Nick Frosst

Aidan Gomez 与两位联合创始人在 Google Brain 和 FOR.ai 分别有过合作,2023 年 2 月,此前在 Youtube 担任 CFO 的 Martin Kon 也加入领导团队,担任总裁和 COO,帮助 Cohere 将商业产品和解决方案推向市场。

跟试图构建 AGI 的 OpenAI、Anthropic 等巨头相比,Cohere 追求的是一个更直接更实际的目标,帮助其他公司更高效地运营。

「我们不是在追逐 AGI,」该公司的联合创始人之一 Nick Frosst 说,「我们正在努力制作可以在企业中有效运行的模型,来解决实际问题。」

在选择创业方向时,Gomez 认为阻碍更多企业、创业公司和开发人员使用大模型技术的困难中,根本性的、最大的障碍之一是计算资源,构建大模型需要拥有数千个 GPU 的算力。

另一个障碍是 AI 的高使用门槛。这个时代,AI 和 ML 的专业知识人才仍然是紧缺的。

所以他想在 Cohere 创建一个能消除这两个障碍的产品。把只有大公司和专家才能做到的事做好,让客户能够很简单地用大模型能力去构建自己的产品。

Cohere 提供的产品存在两大主要应用场景:

  • 首先,是面向外部的创新应用。Cohere 希望帮助行业采用这项技术,作为接口应用到他们所有的产品中。例如,甲骨文医疗公司利用Cohere推出了新一代电子病历平台,简化了患者参与。

  • 其次,是公司内部使用的应用,旨在提升工作效率,为不同部门和员工提供定制化辅助,典型的例子是人力资源部、客服部等多个部门的运营。

27岁,只做toB,估值55亿,不追AGI

02 

ToB、主打定制和隐私安全

客户选择上,Gomez 避开了内卷的 ToC 赛道,不与 ChatGPT 等公司竞争,非常专注于企业,针对企业的需求打造自己的一系列产品和服务。在避开与赛道前两名 OpenAI 和 Anthropic 的竞争后,Cohere 很好的解决了商业客户的需求(高性能,可定制化)和他们的担心(数据可控性)。

定制模型执行的任务包括总结文档、撰写网站文案和支持聊天机器人,为像甲骨文、LivePerson 和 Notion 这样的公司提供服务。Cohere 还运营着一个非营利性研究实验室,Cohere for AI,并发布开放模型,如用于理解和分析文本的多语言模型。其最新的旗舰模型 Command R+旨在以较低的成本实现更昂贵模型(例如 GPT-4o)的许多功能。

27岁,只做toB,估值55亿,不追AGI

最近的 LMSys Chatbot Arena 排行榜上,Command R+的评价高于 GPT-4-0314

就像商业能力很强的云数仓公司 Snowflake 一样,Cohere 也采用了按需付费模式而不是按月或按年付费,而且它的付费模式很精细。Cohere 按照模型的不同能力,包括文本生成,文本总结,重新排名,文本分类等能力制定了不同了价格,而在每一种能力里,模型是否经过定制化,价格也有区分,客户可以根据自己的不同需求任意选择能力和模型的类型。

另外,和消费者不同,企业客户第一重视的是风险。Cohere 内部设置了安全团队,专注于使大模型更可控、更少偏见。

为了让市场更了解项目的技术构建模式,帮助客户熟悉这项技术及其局限性,Cohere 还构建了像是 LLM 大学的 LLMU,里面标识了这项技术可能存在的缺陷,以及如何防范这些缺陷。客户能够完全自主地部署系统,添加自身数据,且所有数据均存储在客户自己的硬件设备上,Cohere 无法接触到任何信息,真正做到了安全无忧。

其次,Cohere 的 AI 平台是云中立的,不会绑定于任何一个特定的云服务商。客户无需担心购买的技术仅限于某一云平台使用,相反,可以部署在任意公共云(例如 Google Cloud、Amazon Web Services)、客户的现有云、虚拟私有云或现场。

Aidan Gomez 认为,商业战略上 Cohere 的资本效率较高。Cohere 在计算上的支出是竞争对手的 20%。但构建的东西是市场真正想要的东西。砍掉 80% 的支出,并交付一些对市场同样有吸引力的东西,这是 Cohere 战略的核心部分。不过,他也提到,Cohere 没有捷径可走。「我们需要说服那些在未来几年内寻求回报的投资人,让他们为我们提供资金。这就是我们的做法。这不应被视为一种另类策略,而是从零开始创立公司的正确方式。

Aidan Gomez 表示,2023 年对 Cohere 来说,有点像是概念验证(POC)的一年。自公司创立到现在已近五年,但直到 2023 年,公众才真正注意到它,开始使用这项技术。目前第一批 POC 已经完成,未来 Cohere 大部分工作重点是生产中的可扩展性

新一轮融资的资金对 Cohere 会有所帮助,Cohere 与 Google Cloud 的持续合作也将提供帮助,其中 Google 提供云基础设施来训练和运行 Cohere 的模型。Cohere 还与甲骨文有着密切的联系,甲骨文既是投资者也是客户;这家初创公司的人工智能已经集成到甲骨文的许多软件产品中,包括 Oracle NetSuite。

03

创始人访谈:AI 落地的核心在于想清楚我们要什么

27岁,只做toB,估值55亿,不追AGI

采访者:你是在谷歌开始了所有这些研究工作。谷歌拥有无限的资源,也拥有巨大的运营规模。鉴于谷歌的基础设施和覆盖面,它优化和降低新技术的成本曲线能力非常高。是什么让你离开谷歌,自己去做这件事?

Aidan Gomez:创始人之一 Nick 也在谷歌。我们都在多伦多为 Geoff Hinton 工作。他是神经网络的创造者,而神经网络是所有这一切的基础,是 LLM 的基础。它支撑着你每天使用的几乎所有 AI。我们很喜欢谷歌,但在那里我没有做产品的雄心和执行力。所以我们不得不创办 Cohere。

谷歌是一个做研究的好地方,我认为它拥有地球上一些最聪明的 AI 人才。但对我们来说,世界需要一些新的东西。世界需要 Cohere,需要能够从一个不依赖于任何一家云计算公司、任何一家超级规模公司的组织那里采用这项技术。

对企业来说,非常重要的一件事是选择权。如果你是一家大型零售商的首席技术官,你可能会将 5 亿美元、10 亿美元用于其中一家云计算提供商的计算服务。为了获得一笔好交易,你需要能够在供应商之间进行可信的转换。否则,他们只会无休止地压榨你,敲诈你。你需要能够转换。你讨厌购买只能在一个堆栈上使用的专有技术。你真的想保留在它们之间转换的选择权。这就是 Cohere 所允许的。因为我们是独立的,因为我们没有被锁定在这些大型云计算公司中的任何一家,所以我们能够向市场提供这一点,这一点非常重要。

采访者:我接触过一些负责为公司采购这类 AI 产品的人员,他们认为像微软 Copilot 这样的产品,其功能过于宽泛,提升生产力的效果不明确,而且价格高昂。Cohere 提供的产品有哪些独特之处?你们的定位是否更精准?

Aidan Gomez:MIT 和哈佛大学目前有一项关于提升生产力的研究,他们的目标是让你可以量化地测量生产力的提升效果。比如让知识工作者坐在这些模型旁边,教会他们如何使用模型,如何使其对自己有益。他们需要学会如何运用这项技术,而一旦熟练掌握 AI,这些工作者就能提升约 40% 的效率。这不仅仅是工作量的提升,还包括质量的提升,而这是由他们的管理者评判的。Cohere 一直致力于优化模型压缩技术,而非单纯追求构建最大规模的模型,因为后者并不符合市场需求。实际上,那种超大规模模型本来也无法顺利应用于生产环境。我们专注于研发一类体积更小、更易于扩展的模型,这类模型具备完全私密性,且成本更低。

采访者:人类语言很容易产生误解,对计算机进行编程是非常确定的。你是如何看待弥合这种差距的?

Aidan Gomez:你用这项技术编程的方式,它是不确定的。它是随机的。它是概率。从字面上看,它有可能说出一切。它有可能说出一些完全荒谬的话。

我认为,作为技术构建者,我们的工作是引入良好的可控性工具,这样概率就变成了数万亿分之一——所以在实践中,你永远不会观察到它。话虽如此,我认为企业已经习惯了随机实体,并使用它来开展业务,因为我们有人类。我们有销售人员和营销人员,所以我认为我们已经很习惯了。这个世界对它的存在具有鲁棒性。我们对噪音、错误和失误具有鲁棒性。希望你能相信每个销售人员,对吧?希望他们永远不会误导或夸大其词,但在现实中,他们有时会误导或夸大其词。所以,当你被一个销售人员推销时,你会对他们所说的话应用适当的界限。“我不会完全把你所说的话当成福音。”

我认为,这个世界实际上对让这样的系统发挥作用具有超级鲁棒性。起初,这可能看起来很可怕,因为“哦,计算机程序是完全确定的。我知道当我输入这个输入时,它们会输出什么。”但这实际上是不寻常的。这在我们的世界里很奇怪。拥有真正确定性的系统是超级奇怪的。这是一件新鲜事,我们实际上正在回到更自然的东西上。

采访者:计算机本来是确定性的,人们围绕着它非常确定性的本质构建了现代性;你知道输入后你会得到什么输出。现在你必须对一群企业说:“花钱吧。把你的企业押注在一种新的计算机思维方式上。”这是一个很大的变化。这行得通吗?

Aidan Gomez:这可以追溯到我所说的,要了解在哪里部署这项技术,在哪里已经做好了准备、足够可靠。

有些地方,我们目前并不会部署这项技术,因为它还不够强大。我很幸运,因为 Cohere 是一家企业级公司,我们与客户的合作非常密切。这不像我们把它扔出去,然后希望他们成功。我们深度参与这个过程,帮助他们思考应该在哪里部署它,以及他们想要推动什么样的改变。我希望没有人把他们的银行账户交给这些模型来管理他们的资金。

在某些地方,是的,你需要确定性。你需要非常高置信度的护栏。你不会仅仅把一个模型放在那里,然后让它决定自己想做什么。在绝大多数用例和应用程序中,它实际上是关于增强人类能力的。所以你有一个正在努力完成工作的员工,他们将使用这个东西作为一种工具,让自己更快、更有效、更高效、更准确。它增强了他们的能力,但他们仍然在工作流程中。他们仍然在检查那项工作。他们仍然在确保模型产生的是合理的东西。归根结底,他们要对自己做出的决定以及他们在工作中如何使用该工具负责。

我们真的将全部工作都交给这些模型,之后会发生什么,那还是很遥远的事。我们需要有更多的信任和可控性,以及建立这些护栏的能力,以便它们的行为更加确定。

采访者:你提到了对这些模型进行提示,以及通过与它们交谈来控制它们,这很有趣。这就像是一场严厉的训责。

Aidan Gomez事实上,你可以使用这种方法有效地控制大模型的行为。但除此之外,除了仅仅提示和与它们交谈之外,你还可以设置模型之外的控制和护栏。你可以让其他模型监视这个模型,并在某些情况下进行干预,阻止它执行某些操作。我认为我们需要开始改变的是我们的观念,这是一个模型吗?它是一个人工智能,我们只是将控制权交给了它。如果它搞砸了怎么办?如果一切都出错了怎么办?

在现实中,它将是更大的系统,包括确定性的观察系统,并检查故障模式。如果模型这样做了,它就脱轨了。关闭它。这是一个完全确定性的检查。然后你会有其他模型,可以观察并对模型进行反馈,以防止它在误入歧途时采取行动。

编程范式,或者说技术范式,开始于你所描述的那样,即有一个模型,你要把它应用到某个用例中。它只是模型和用例。它正在转向更复杂、组件更多的更大系统,它不再像是一个人工智能,你应用它来为你工作,而实际上是你部署来为你工作的复杂软件。

Cohere 的盈利模式

采访者:你认为 Cohere 业务收入达到数十亿美元的路径是什么?时间线是什么?

Aidan Gomez:我不知道我能透露多少,它比你想象的要近。在今天的企业市场上,客户已经在这项技术上花费了数十亿美元。

我认为 2023 年是人们真正认识到这项技术的一年。这一年可以称为概念验证之年。当时,只有少数团队,比如五到十人的小团队,在构建、摸索,熟悉 AI 技术。如今,情况正在发生变化。技术正逐渐走向实际应用,那些概念验证项目逐渐显现出成果。

他们开始说:“我喜欢我构建的产品,我想要将其推向市场。” 这时候,我之前提到的摩擦点开始显现。概念验证阶段的支出大约是生产工作负载的 3-5%。但现在,这些生产工作负载正在上线。这项技术正在应用于与数千万或数亿人交互的产品中,真的变得无处不在了。这是典型的技术采用周期。

企业的行动很慢。他们往往在采用新技术方面行动迟缓。他们非常顽固。一旦他们采用了一种东西,它就会永远存在下去。但他们需要一段时间来建立信心,并真正做出决定来承诺和采用这项技术。从人们意识到这项技术到现在,才过去了一年半的时间,但在这短短的一年半时间里,我们现在开始看到真正认真的采用和真正的生产工作负载。

概念验证项目还在五人的时候,成本并不会很明显。可扩展性成本在小范围内并不关键,因为你实际上并未将其大规模部署。然而,当他们说,“概念验证成功了,让我们将其推向大规模应用。这需要多少成本?” 这时,成本问题就凸显出来了。

所以,我们正试图通过构建更快、更经济的技术来解决这一问题。我们为 Cohere 筹资的方式并不是从云服务商那里接受巨额的支票,然后又将这些资金回流给它们用于计算资源来构建模型。我们的投资者,他们期望得到投资回报率(ROI)。为了获得他们的投资,我们必须达到极高的标准。我们追求的是一个充满竞争、正规且务实的公司建设过程。这是创建成功公司的正确路径,是构建成功业务的方式。

采访者:微软是 OpenAI 的大投资者。他们有自己的模型,是你的主要竞争对手。你显然是挑战者,是一家初创公司。微软有 30 万名员工。你有三四百名员工。你是如何从微软那里赢得业务?

Aidan Gomez:他们在某些方面是竞争对手,但他们也是我们的合作伙伴和渠道。我们发布新的模型 Command R 和 Command R+ 时,它们首先在 Azure 上可用。我绝对将他们视为将这项技术带入企业的合作伙伴,我认为微软也将我们视为合作伙伴。他们希望创建一个由许多不同模型驱动的生态系统,他们将拥有 OpenAI 的模型和我们的模型,这将是一个新的生态系统,而不是仅仅是微软的专有技术。

拿数据库领域举例,Databricks 和 Snowflake 这样出色的公司,它们都是独立的,并不是亚马逊、谷歌或微软的子公司。它们之所以做得这么好,是因为它们拥有令人难以置信的产品愿景。他们正在构建的产品对客户来说确实是最好的选择。

我之前讲过,CTO 不想被锁定在一个专有的软件堆栈中,因为这对他们谈判的能力来说是一种痛苦和战略风险。人工智能领域这一点更为重要,因为这些模型成为了数据的延伸,是数据的价值所在。数据将为人工智能模型提供动力,从而创造价值,但数据本身并不具有内在价值。

像微软、Azure、AWS 和 GCP 这样的公司,他们需要我们存在。如果他们不这样做,市场就会坚持要求能够采用独立性的平台,让他们在云之间转换。所以他们不得不支持我们的模型。这就是市场的需求。我不认为他们仅仅是竞争对手。我认为他们是这项技术推向市场的合作伙伴。

采访者:你们专注企业,发现了一群有需求的客户。有一些大型的消费者 AI 公司正在构建大型的消费者产品。他们的想法是,人们每月支付 20 美元与这样的模型交谈,但这些巨头公司在培训上的花费比你们多。但也有一整个生态系统的公司在向 OpenAI 和谷歌支付利润来运行他们的模型,并用更低的价格销售消费者产品。在我看来,这一模式不可持续。

Aidan Gomez:我认为那些建立在 OpenAI 和谷歌之上的人应该建立在 Cohere 之上,我们会是更好的合作伙伴。

这些公司的关注点、技术提供商的关注点,可能会与其用户发生冲突,你可能会发现自己处于这样的境地——我不想指名道姓,但假设有一家初创公司正试图为全世界构建一个 AI 应用程序,而它构建在一个也在构建消费者 AI 产品的竞争对手之上。这其中存在着内在的冲突,你可能会看到这个竞争对手窃取或剽窃这家初创公司的创意。

这就是我认为 Cohere 需要存在的原因。你需要像我们这样专注于构建平台的人,让其他人能够去创建这些应用程序——并且真正投资于他们的成功,而不受任何冲突或竞争性质的影响。

这也是我认为我们是一个非常好的合作伙伴的原因,因为我们专注于此,并且我们让我们的用户取得成功,而不会试图在同一个领域竞争或参与竞争。我们只是构建了一个平台,你可以使用它来采用这项技术。这就是我们所有的业务。

采访者:OpenAI 现在与微软有协议,规定 OpenAI 的所有业务必须在微软 Azure 上运行。我们可以看到 Anthropic 与谷歌和亚马逊也有类似协议,要求它们在各自云平台上运行一定比例的业务。顺便说一句,这些公司并非直接支付数亿美元现金,很多投资是以云服务 credits 的形式提供的。那么,这种模式是否存在问题?因为你们没有采用这种方式。你们选择的是更为传统的方法,即「请投资者给我们写张支票,将来我们会给你回报」。

Aidan Gomez:确实如此。我不想对竞争对手的融资策略发表评论,但我可以说,Cohere 致力于构建真正的业务,一个面向世界的独立新公司。我们明白,没有捷径可走。我们需要说服那些在未来几年内寻求回报的投资人,让他们为我们提供资金。这就是我们的做法。我们认为,这始终是建立一家健康的企业的正确途径。这不应被视为一种另类策略,而是从零开始创立公司的正确方式。

采访者:最后,由于 Cohere 的业务性质,你肯定与众多企业有过交流。对于非科技公司来说,尽管它们都在运用技术,但它们的商业模式正发生怎样的变化?或者说,它们如何思考利用人工智能来变革自己的商业模式,无论是你所提供的产品,还是竞争对手的做法。

Aidan Gomez:我认为它们正将 AI 技术视为取得竞争优势的关键

举个例子,我们曾与一家专注于自然资源项目(如石油管道、矿山)保险的公司合作。当矿业公司计划启动新项目时,通常会发布保险需求的招标通知。这实际上变成了一场竞标赛。率先提交合理报价的保险公司往往能赢得合同。

我们与该公司合作,为负责项目研究、风险评估及定价的精算师提供了支持。我们引入了一个模型,它能够访问所有精算师制定报价时参考的数据来源。这极大地提升了精算师的工作效率,使得公司能获得更多的合同机会。我从未想象过一家专注于自然资源项目的保险公司会采用大型语言模型,但他们确实在这么做,因为他们致力于提升业务竞争力。他们的竞争优势就在于速度。这就是他们投资的焦点,而他们也确实取得了卓越的成果。这直接转化为生产力的显著提高。

AI 产业是否是泡沫?

采访者:我想问,AI 产业是否是一个泡沫。训练大模型的成本很高。开发它们的成本很高。你必须围绕着新模型及其功能重建你的技术——仅仅运营公司和计算,每年就需要数亿美元。这还没有算上工资,人工智能行业的工资相当高,所以这又是你需要支付的一大笔钱。办公空间的费用、笔记本电脑等等一大堆东西。你认为收入能达到足以证明这种纯粹的计算量运营成本合理的水平吗?

Aidan Gomez:当然可以。如果我们看不到,我们就不会去做了。

采访者:我想你的竞争对手也会说,这会实现的,但其中有很多一厢情愿的想法。我之所以先问你这个问题,是因为你已经创办了一家企业级企业,我便假设你看到了更清晰的道路。但在行业中,我看到很多人是一厢情愿地认为,这将在未来实现。

Aidan Gomez:我完全同意。

采访者:当你环顾整个行业时,你认为这是一个泡沫吗?

Aidan Gomez:我不这么认为。我真的不这么认为。我不知道你每天使用 LLM 的频率。我经常使用它们,比如每小时使用多次,所以它怎么会是一个泡沫呢?

采访者:你的一些竞争对手一般在筹集资金的时候是说,“我们要在 L1 的基础上构建 AGI”,或者“我们实际上需要暂停开发,因为我们可能会用这项技术毁灭世界”。在我看来,这些东西相当像泡沫。但你似乎并不担心这一点。你认为这会自我平衡吗?

Aidan Gomez:除了我非常同意这是一种不稳定的局面之外,我不知道该说些什么。现实情况是,对于像谷歌和微软这样的人来说,他们可以花费数十亿美元。他们可以在这个上面花费数百亿美元,这没关系。这只是一个舍入误差。对于采用这种策略的初创公司来说,你需要成为其中一家大型科技公司的子公司,或者做一些非常糟糕的业务建设才能做到这一点。

这不是 Cohere 正在追求的。我在很大程度上同意你的观点。我认为我们的策略需要专注于实际交付市场能够消费的东西,构建适合我们客户的规模或尺寸的产品和技术。这就是所有成功企业都是如何建立起来的根本。我们不想让自己走得太远。我们不想花那么多钱,以至于很难看到盈利之路。

Cohere 的重点是建立一个自给自足的独立企业,所以我们不得不认真思考这些问题,并引导公司朝着支持这一目标的方向发展。

AI 的能力与局限性

采访者:过去七年里,很多人质疑人工智能,但 AI 一直在打破预期,超越我们认为这项技术可能实现的目标。话虽如此,我认为这项技术仍然存在缺陷。我担心因为这项技术与与人互动的感受非常相似,人们会高估它,或者对它过于信任,将它部署到了一些它还没有准备好的场景中。

所以我想问,你认为语言和智能在这里是一回事吗?或者你认为它们在技术上是否并不以同样的速度和道路前行?我们越来越善于让计算机使用语言,而智能则以不同的速度增长,或者可能停滞不前?

Aidan Gomez:我不认为智能和语言是一回事。为了理解语言,你需要高度的智能。问题是这些模型是理解语言,还是只是在重复我们的语言。

采访者:这是谷歌另一篇非常著名的论文:随机鹦鹉论文。它引起了很多争议。这篇论文的观点是,这些模型只是在重复我们的话,并没有什么更深层次的智能。事实上,通过向我们重复事物,它们将表达出事物被训练的偏见。

是智能在克服障碍,对吧?智能将帮助你超越你自身的学习。你一开始就是这样看待它的吗?这些模型可以超越它们的训练吗?或者它们将永远受到训练数据的限制?

Aidan Gomez我想说的是,人类会做很多鹦鹉学舌的事情,并且有很多偏见。在很大程度上,我们所知道的确实存在的智能系统——人类——我们做了很多鹦鹉学舌的事儿。有句谚语说,我们是读过的 10 本书或离我们最近的 10 个人的平均值。我们是根据我们在世界上看到的东西来塑造自己的。

与此同时,人类是真正有创造力的。我们做一些我们以前从未见过的事情。我们超越了训练数据。我认为这就是人们所说的智能,即你能够发现新的真理。

这不仅仅是重复你已经看到的东西。我认为这些模型不仅仅是在重复它们看到的东西。我认为它们能够外推到我们已经展示给它们的东西之外,识别数据中的模式,并将这些模式应用到它们从未见过的新输入中。明确地说,在现阶段,我们可以说我们已经超越了随机鹦鹉假说。

采访者:这是这些模型的一种让你感到惊讶的涌现行为吗?这是你一开始在谷歌研究 Transformer 时就想到的事情吗?你说这是一个七年的旅程。你是什么时候意识到这一点的?

Aidan Gomez:早期有几次。在谷歌,我们开始用 Transformer 训练语言模型。我们只是开始尝试它,它和你今天交互的那种语言模型不一样。它只是在维基百科上训练出来的,所以这个模型只能写维基百科的文章。

采访者:那可能是所有这些版本中最有用的一个。[笑]

Aidan Gomez:是的,也许吧。但它是一个更简单的语言模型版本,看到它很令人震惊,因为在那个阶段,计算机几乎无法正确地把一个句子串在一起。它们写的东西都没有意义。有拼写错误,那只是一堆噪音。突然有一天,我们醒了,从模型中取样,它像人一样流利地写下了整篇文档。这对我来说是一个巨大的冲击。那一刻,我对这项技术充满了敬畏,而且这种感觉一次又一次地重复出现。

我经常会担心这个东西只是一个随机的鹦鹉。它也许永远无法达到我们想要的效用,因为一些根本的瓶颈我们无法让它变得更聪明,无法把它推到某种能力之外。

但是,每次我们改进这些模型时,它都会突破这些阈值。在这一点上,我认为这种突破将继续下去。我相信,只要有足够的时间和资源,我们就能实现我们希望这些模型能够做到的任何事情。重要的是要记住我们还没有达到最终状态。在一些领域这项技术还没有做好准备。例如,在没有人工监管的情况下,我们不应该让这些模型给人们开药。也许有一天它会准备好。在某些时候,你可能会拥有一个已经阅读了人类所有医学知识的模型,而你实际上会比信任一个由于人类时间有限而只能阅读一部分知识的人类医生更信任它。我认为这是一个非常可能的未来。今天,在现实中,我希望没有人从这些模型中获取医疗建议,现在仍然需要有人工参与其中。你必须意识到存在的局限性。

人工智能的风险存在吗?

采访者:你曾经说过,人工智能代表着生存风险——你认为真正的风险是什么?

Aidan Gomez:我认为真正的风险是我们之前谈到的那些:过早地、过于急切地部署这项技术;在坦率地说,人们不应该在没有人工监督的情况下将它们部署到某些场景中。我非常理解公众对世界末日或终结者场景的担心。我对这些场景很感兴趣,因为我看过科幻小说,而且结果总是很糟糕。几十年来,我们一直在听这些故事,思考它超级令人兴奋和有趣,但这不是现实。这不是我们的现实。作为一个技术人员,与这项技术本身非常接近的人,我认为我们并没有朝着媒体和那些正在构建这项技术的公司经常所说的方向前进。

我真的希望我们能把注意力集中在两件事上。一个是今天就存在的风险,比如过早部署、在没有人工监督的情况下部署它们,等等。当我与监管机构、与政府官员交谈时,他们真正关心的是这些事情。这不是世界末日的情景。如果金融行业以这种方式采用它,或者医疗行业以这种方式采用它,它是否会伤害公众?他们非常务实,实际上是基于这项技术的现实。

另一件我真正希望看到的是关于机会的讨论,积极的一面。我们在负面、恐惧、厄运和悲观情绪上花费了太多时间。我希望有人能够谈论我们可以用这项技术做什么,或者我们想做什么,尽管引导人们远离潜在的负面路径或糟糕的应用很重要,但我也想听听公众对这些机会的看法和公开讨论。我们能做什么好事?

一个例子是医学领域。

显然,医生们 40% 的时间都花在了做笔记上。在病人就诊的间隙——你和病人互动,然后你离开,走到你的电脑前,你说:“某某来了。他们有这个症状。我记得几周前他们来的时候,看起来是这样的。下次他们来的时候,我们应该检查一下这个。我给他们开了这种药。”他们在与病人互动之间花了很多时间来写这些笔记。

我们可以给医生佩戴被动式监听麦克风,让他们从一次会诊到下一次会诊都戴着,将谈话内容转录下来预先写好。因此,他们不必从头开始写下整个内容,而是通读一遍,然后说:“不,我没有这么说,我是这样说的,并添加了这些内容。”它变成了一个编辑过程,将这 40% 的时间缩短到 20%。一夜之间,我们就多了 25% 的医生时间。我认为这太不可思议了。这对世界来说是一个巨大的福音。我们没有花钱培训医生,没有让更多的人去医学院学习。仅仅通过采用技术,他们就多了 25% 的时间。

我想找到更多这样的想法。Cohere 应该优先考虑什么应用?我们需要在哪些方面做得更好?我们应该解决什么问题,才能推动我们希望在世界上看到的好的事物?没有关于这方面的头条新闻,没有人谈论它,我真的希望我们能进行这样的对话。

采访者:作为一个记者,我认为人们会怀疑的是:没有足够的例子来说明这是真的,第二想法是,“哦,天哪,一大堆急救诊所股权持有者刚刚把 25% 的病人塞进了医生的日程表里。”

人们会觉得现在人工智能公司正在索取很多,却没有给予足够的回报。你在企业角度,你显然没有这种感觉,但你有没有看到——你训练了一堆模型,你应该知道数据来自哪里。参与制作这些模型的人们可能希望得到补偿?

Aidan Gomez:哦,是的,完全同意。我非常理解这一点。

采访者:你会为你的训练数据付费吗?

Aidan Gomez:我们为数据付费。我们为数据支付了很多钱。数据来源有很多种。有些东西是我们从网上抓取的,当我们这样做的时候,我们会尽量尊重人们的偏好。如果他们表示“我们不希望你收集我们的数据”,我们会遵守。当我们抓取代码时,我们会查看 robots.txt。我们会查看与该代码相关的许可证。我们会过滤掉那些人们明确表示“不要抓取这些数据”或“不要使用这些代码”的数据。如果有人给我们发电子邮件说:“嘿,我认为你抓取了 X、Y 和 Z,你能删除它吗?”我们当然会删除它,并且所有未来的模型都不会包含这些数据。我们不想用那些人们不希望我们用来训练的东西来训练,这是毫无疑问的。我非常、非常理解创作者,我真的很想支持他们,并构建工具来帮助他们提高效率,帮助他们进行构思和创作过程。这就是我想要产生的影响,我真的想尊重他们的内容。

大语言模型能承载人类的期望吗?

采访者:我想问一个我一直以来思考最多的一个问题,我们正在给这些模型施加很大的压力——商业压力、文化压力、灵感压力。我们希望我们的计算机能够做这些事情,而基础技术就是这些 LLM。它们能承受住这种压力吗?它们能承受住我们期望的负担吗?这一点对我还不清楚。

Aidan Gomez: 我认为我们永远不会对这项技术感到满意。如果我们两年后再聊天,我们会对这些模型没有快速发明新材料来让我们获得任何东西感到失望。我认为人们总是会感到失望,并想要更多,因为这只是人性的一部分。我觉得这项技术在每个阶段都会给我们留下深刻的印象,并迎接挑战,超越我们之前对它的期望,但人们不会有“我们已经完成了,我们很好了”的感觉。

采访者:我不是问它是否已经完成了。我是说,你是否看到,随着这项技术的发展,它能够承受住我们期望的压力?它是否有能力,或者至少有潜在的能力,来真正构建人们期望构建的东西?

Aidan Gomez: 我绝对认为它可以。曾经有一段时间,每个人都认为:“这些模型会产生幻觉。它们会编造东西,它们永远不会有用。我们不能相信它们。”而现在,幻觉率,你可以追踪它们多年来的变化,它们已经大幅下降,并且已经变得好多了。对于每一个抱怨,或者每一个根本性的障碍,我们所有构建这项技术的人都在努力,我们改进了这项技术,它超越了我们的期望。我希望这种情况能够继续下去,看不出它有什么理由不能继续下去。

采访者:你认为幻觉率会降到零吗?对我来说,那就是它被解锁的时候。当它不再对你撒谎的时候,你就可以开始真正地依赖它了。现在,所有的模型都以非常滑稽的方式产生幻觉。至少对我来说,有一部分原因是,我还不能相信它。幻觉率会降到零吗?你能在路线图上看到这一点吗?你能看到一些可能让我们实现这一目标的技术发展吗?

Aidan Gomez: 你和我的幻觉率都不为零。

采访者:好吧,是的,但没有人相信我会管理任何事情。[笑] 我坐在这里问问题,而你是首席执行官,这是有原因的。如果你要把计算机像这样纳入循环,你就会希望它达到零幻觉率。

Aidan Gomez: 不,我的意思是,人类会记错东西,他们会编造东西,他们会弄错事实。如果你问 AI 是否能够战胜人类的幻觉率,我认为可以,当然可以。因为人类会产生很多幻觉,我认为大模型可以为世界创造一些非常有用的东西。

采访者:从历史上看,我们对计算机的信任程度一直很高。而对于其中一些技术,这种信任程度已经下降了,这真的很有趣。

Aidan Gomez: 我不认为大型语言模型应该为人们开药或进行医疗。但我向你保证,如果你带着一系列症状找我本人,让我给你诊断,你应该更相信 Cohere 的模型,而不是我。它比我更了解医学。无论我说些什么,都会比模型差很多。这已经是事实了,就在今天,此时此刻。与此同时,我和模型都不应该给人们诊断。但它更值得信赖吗?在我这个例子上,你真的应该更相信那个模型,而不是 Aidan。

在现实中,你真正应该相信的是那些接受过十年教育的真正的医生。这个模型现在是略高于 Aidan,标准是真正的医生,我们将会达到那个标准,我绝对相信,到那时,我们就可以盖上印章,说它是值得信赖的。总有一天,它会比普通医生更准确。我们将会在这项技术上实现这一点,没有理由相信我们做不到。但这是一个持续的过程。相不相信信这项技术不是一个二元选择。而是,你可以在哪个领域相信它?

在医学领域,目前我们真的应该依靠人类。但在其他地方,你可以多使用人工智能。当有人工参与时,AI 实际上只是一种辅助工具,一个增强工具,真的可以帮助你提高效率,做更多的事情,或者让你玩得开心,更加了解这个世界。在某些地方,你已经可以有效地信任它,并且部署它了。人们部署这项技术并信任它的空间只会越来越大。关于你的问题,这项技术是否能够迎接我们希望它做的所有事情的挑战?我真的非常相信它可以。

文章来源微信公众号“Founder Park”

发评论,每天都得现金奖励!超多礼品等你来拿

后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则
暂无评论...