红杉称生成式AI为“现代的奇迹,我们这一代的太空竞赛。”
这一刻,我们已经酝酿了几十年。
摩尔定律的六十年为我们提供了处理浮点数据的计算能力,互联网的四十年为我们提供了数万亿代币的训练数据,移动和云计算的二十年让每个人的手掌中都有一台超级计算机。这些科技进步都将成为生成式AI起飞的基点。
ChatGPT的崛起迅速将生成式AI从模型时代带入应用时代。
尽管一直有人在唱衰生成式AI的实际用途,大肆宣传其“糟糕的”用户留存率,噪声和不确定的质疑一直都在,就像当初他们看互联网一样。
但并不妨碍它将成为下一个互联网。
生成式AI未来的走向如何,红杉给出了自己的答案。
全新的 AI 图谱
生成式AI已经进入了全新的第二阶段。
关于第一阶段,红杉认为,其核心在基础模型以及由此带来的一波新 AI 应用;而现在第二阶段的核心,则在真正解决客户需求的应用,这些应用与第一波 AI 应用有本质上的不同:
“它们倾向于将基础模型作为更全面解决方案的一部分,而不是整个解决方案。它们引入了新的操作界面,使工作流程更加具有粘性,输出也更好,同时它们往往是多模态的。”
在第二阶段里,典型的产品包括了法律领域 AI Harvey,AI 伴侣 Character AI 和 Ava 以及企业搜索和知识管理平台 Glean。
其中法律领域的 AI,红杉认为是目前 AI 真正起飞并且对行业从业者带来的更多正面影响的一个垂直行业,除了 Harvey 也包括之前介绍过的其它多个产品,比方说 EvenUp,它被 Benchmark 合伙人 Sarah Tavel 认为会在其所在行业占据主导地位,有的律所客户在使用其产品后一个季度的收入已经是其之前一年的了。当然类似 Character AI 这种提供情绪价值的 AI 伴侣产品也是红杉一直比较看好的一个方向。
为此,红杉绘制了一个全新的 AI 图谱。
本次的AI图谱,是按照应用场景的使用案例来做的产品分类,它反映了两个重要的市场表现:
1、生成式AI从技术工具向应用场景落地
2、生成式AI应用呈现日益多模态化趋势
此外,红杉还发布了一个新的LLM开发者栈图谱,反映了公司在构建生成式AI应用程序时所需要的计算和工具产品,基本上覆盖了开发者在开发 AI 应用过程中可能需要用到的所有工具,如下图:
生成式AI的问题
毫无疑问,生成式AI的起步已经比SaaS更加成功,仅从初创公司就获得了超过10亿美元的收入(SaaS市场需要几年,而不是几个月,才达到同样的规模)。
一些应用已经成为家喻户晓的名字:ChatGPT成为增长最快的应用,尤其在学生和开发者中有很强的产品市场契合度;Midjourney成为我们的集体创意缪斯,据报道仅用11个团队就达到了数亿美元的收入;Character推广了AI娱乐和伴侣,并创造了我们最渴望的消费者“社交”应用——用户平均在应用中花费两个小时。
尽管如此,这些成功的早期迹象并没有改变一个事实,那就是许多AI公司根本没有产品市场契合度或可持续的竞争优势,这将导致整个AI生态系统的繁荣是不可持续的。
红杉认为,生成式 AI 并不缺应用场景和客户需求,人们都希望能通过它提高效率,这从 ChatGPT 的快速增长就能看出。
但是在用户留存这块还有比较大的空间,红杉将 AI 优先的几个产品和现有一些产品的留存做了一下比较,平均来看还是有不少差距的,如下图:
在用户的参与度这块,除了类似 Character AI 这种 AI 伴侣类产品,差距也比较大,这意味着用户还没有发现足够的价值来每天使用生成式人工智能产品。
整体来说,红杉认为生成式人工智能最大的问题不是找到应用场景或者说需求,而是如何证明价值。当然 AI 还处于一个非常早期的阶段,这些需要通过时间来慢慢解决。
预测的对与错
1、正确的预测:
文中提到,红杉曾经成功预测了生成式AI的一些发展趋势,包括:
1)生成式 AI 确实成了风口。
突然之间,每个开发者都在开发生成式AI应用,很多企业都在买它用它,再加上人才和风险投资资本的涌入,让生成式AI彻底成为了流行文化现象。
2)第一批杀手级应用已经出现。
ChatGPT 是全球最快达到 1 亿月活用户(MAU)的应用,仅仅用时 6 周。相比之下,Instagram 用了 2.5 年,WhatsApp 用了 3.5 年,YouTube 和 Facebook 用了 4 年。同时,ChatGPT 并不是一个孤立的现象。Character AI 的深度参与度(平均每次使用 2 小时),Github Copilot 的生产力优势(效率提高 55%),以及 Midjourney 的商业化路径(数亿美元的收入)都表明,第一批杀手级应用已经到来。
3)开发者是关键。
在过去的几个季度中,红杉接收到各种各样的创业产品,从音乐生成社区到 AI 红娘到 AI 客户支持代理都有。开发者可以打开你甚至无法想象的应用场景。
4)产品形态在不断演变。
AI 应用的第一批产品主要是在内容创作方面,做自动补全和初稿的撰写,但在产品形态上现在正在变得更加复杂。Midjourney 引入的相机平移和填充是一个很好的例子,说明 AI-first 的用户体验变得更加丰富。总体而言,产品形态正在从个人生产力向系统级生产力,以及从人机交互到面向执行的代理系统演变。
5)版权和伦理等问题。
类似的热门话题的争论一直没有停过,艺术家、作家和音乐家分成两派,一派认为 AI 可能侵犯了他们的版权,另一派则非常积极地拥抱 AI 帮助自己的创作。当然,监管也是个大问题。
2、错误的纠正
经过一年的发展,红杉也正视了一些错误的观点,并做了如下纠正:
1) AI 的发展速度比预计的快很多。
去年,红杉对AI的发展速度做了预测,预计需要近十年时间实现实习生级别的代码生成、好莱坞级的视频效果和类人语音的克隆和生成。但出人意料,基于 Eleven Labs 的声音已经在 TikTok 普及、Runway 举办了 AI 电影节。甚至 3D 模型、游戏和音乐也在迅速变得越来越好。
2)发展瓶颈不在需求端而在供应端。
GPU的需求量大大超过了红杉的预测,很多公司发展生成式AI的瓶颈已经不再是客户需求的扩展,而是如何获取英伟达最新 GPU 的渠道。为了满足长时间排队等待的客户需求,一种新的商业模式诞生了:支付订阅费以跳过排队,以便尽快获得模型。
3)垂直分离尚未发生。
去年红杉认为,“基础层”模型供应商和“应用层”服务企业将分化开来,模型公司专门从事规模和研究,应用层公司专门从事产品和用户 UI。但今年,这种分离还没有完整地发生,现在最成功的面向用户的应用产品一开始就是垂直整合的。
4)竞争环境的残酷程度和现有者的迅速反应。
去年,虽然在图像和内容生成赛道有一些拥挤,但总体而言市场仍属于蓝海。但今天,竞争要多于机会,现有公司的快速反应也令人乍舌,从 Google 的 Duet 和 Bard 到Adobe 的 Firefly,都在进入快车道,这种甘愿冒“风险”的态度,加剧了竞争。即使在基础模型层面上,也能看到客户会选择各种不同的供应商来建立其基础设施。
5)护城河在客户,而不是数据。
去年红杉预测,最好的生成式AI公司可以通过数据飞轮(更多使用→更多数据→更好的模型→更多使用)来产生可持续的竞争优势。虽然这在某种程度上仍然是正确的,特别是在具有非常专业和难以获取数据的领域,但“数据护城河”的基础是不稳固的:应用产品生成的数据并不能创造无法逾越的护城河,下一代基础模型很可能会摧毁初创公司生成的任何数据护城河。相反,工作流程和用户网络似乎正在创造更持久的竞争优势来源。
通用脚本诞生
经过这一年的发展,红杉认为,在大模型的使用和新的 UI 范式领域,已经形成了一些通用的脚本。这包含了模型的开发栈以及新兴产品蓝图。
1、模型的开发栈
各种技术的不断发展正在缩小基础模型期望与现实的差距。
新兴的推理技术,正在提高模型执行更丰富、更复杂推理任务的能力,缩小客户期望和模型能力之间的差距。
随着 GPT-3.5 和 Llama-2 的微调功能的推出,RLHF 和微调这样的迁移学习技术正在变得越来越可行,这意味着公司可以将基础模型适应到他们特定的领域,并从用户反馈中进行改进。开发人员正在从Hugging Face 下载开源模型并对其进行微调,以实现更好的性能。
在用户的上下文背景方面,检索增强生成技术正在被引入,减少幻觉,增加真实性和实用性。
新的开发工具和应用框架为公司提供了可重复使用的构建模块,以创建更先进的人工智能应用程序,并帮助开发人员评估、改进和监控生产中的人工智能模型。
AI 优先的基础设施公司正在解构公有云,并提供 AI公司最需要的东西:成本合理、按需可用、高度可扩展的大量 GPU,以及良好的 PaaS 开发者体验。
2、新产品的蓝图
生成式交互。基于文本的对话式体验在慢慢地发生变化,它不再是 LLM 之上仅有的默认交互形式,出现了从生成式用户界面到类人声音等新形态。
新编辑体验。比如新的类似相机的编辑体验,比如Eleven Labs 通过提示来操纵声音。
越来越自主的系统。生成式AI应用现在具有自主性,能够解决问题,访问外部工具。
系统的优化。不只是针对单个用户的工作流程提升效率,而是从系统范围去优化问题。
整体来看,随着大家对大模型的新奇逐渐消失,生成式 AI 市场的性质正在发生变化,市场更加关心真正的价值和产品的整体体验。
“杀手级应用的出现和大规模终端用户的需求,让我们对市场有了更强大的信心。”
文章转载自微信公众号”青投创新“
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则