Midjourney 在没有任何融资的情况下做到了 2 亿美金的收入,成为大家非常关注的一个案例。关于它要进军硬件领域的消息传了好久,今天 Midjourney 在 X 上正式官宣了这个消息,并给出了招聘渠道,整个硬件团队位于旧金山。
事实上,去年 12 月份 Midjourney 就已经有硬件负责人了,就是 Vision Pro 团队的一位关键成员 Ahmad Abbas,他之前在 Leap Motion 待了快 4 年,后来在苹果待了 5 年。
而作为 Leap Motion 的联合创始人,Midjourney 创始人 David Holz 对硬件可以说非常熟悉了,但这次到底会做什么样的产品,目前还没有正式公开。
之前有传言称其硬件产品可能类似一个球体(Orb),通过一个设备,使任何人都能组织和管理数以万计的虚拟 3D 空间。
后来 David Holz 在一次 Office Hours 会议上称,Midjourney 要做的硬件是某种实时开放世界的全息影像系统(Real-Time Open World Holodeck)。
今天,其官方账号称它们还没有正式宣布任何的硬件产品,但是已经做出了多项努力,因此最后有可能不只是一款产品,看来对硬件还是非常的执着。
另外,对话式语音 AI 这块似乎正在迎来一个快速发展的阶段,前几天在介绍对话式语音 AI 这块的进展时,曾介绍了一个由华人团队做的 AI 产品,在还没有做任何销售和市场推广的情况下,不到 6 个月实现了 300 万美金 ARR,并且完成了新的一轮融资。
当时我说这应该是一个比较明确的市场需求信号,同时提到了另一款对话式语音 AI 产品 Bland AI,它刚推出产品时号称是全球最快的对话式 AI,它可以同时发送或接收高达 50 万+的电话呼叫,以人类的速度用任何声音回应。
在文章中我说 Bland AI 推出了那么久一直没有公布一些新的进展,没想到今天 Bland AI 就宣布完成了新 A 轮融资,金额 1600 万美金,由 Scale Venture Partners 领投,其他投资人包括了 YC、Paypal 联合创始人 Max Levchin、Eleven Labs CTO Piotr Dąbkowski 以及 Twilio 创始人 Jeff Lawson 等。
加上之前没有正式公布的 600 万美金种子轮,Bland AI 目前总共拿了 2200 万美金。在介绍自己时 Bland AI 也称其为 AI Employee,是一个可定制的电话呼叫代理,听起来就像人类一样。
它可以用任何语言或声音交谈,专为任何用例而设计,可以同时处理数百万个呼叫,而且是 24/7 服务。目前主要针对的应用场景在呼叫中心这块,这是一个规模超过 300 亿美元的产业,每天有 135 亿个电话被打出,其中数亿通电话就发生在呼叫中心。下面是其一个 Demo 视频:
Bland AI 说,呼叫中心工作是世界上流失率最高的工作,这些工作很辛苦,工资不高,而且重复性很强。这就意味着培训、入职和招聘成本高,具备处理中等复杂电话的背景或教育背景的人不多,而这些电话是企业与客户互动的支柱,因此它们希望通过对话式语音 AI 来解决这些问题。
为了消除幻觉,Bland AI 构建了一个叫做 Conversational Pathways(对话路径)的编程语言,它允许你将提示拆分为独特的节点。一旦建立了路径,AI 代理就可以遍历路径,找出正确的回应。下图是提供的一个案例:
在延迟这块,他们构建并托管了自己的 TTS、推理和转录模型。而且还对所有的通话情况(从实时日志到通话后分析)提供了完全透明的信息,以供后续观察分析。
在生态支持这块,Bland AI 可与任何其他系统集成,从文件中检索知识,并能在必要时转给人工;它具有通话记录、通话后分析等功能,并能根据你自己的通话数据对 AI 进行训练;同时还具有语音克隆、多语言支持、人工智能测试系统以及无限通话扩展能力。
目前像 Better.com 和 Sears 已是其客户。就像我在之前文章里所说那样《华人团队 6 个月 300 万美金 ARR,对话式语音 AI 开始做收入了》,对话式语音 AI 可能进入实际应用做收入阶段了,取代像一些基础客服岗位的浪潮可能要加速了。
文章来源于“投资实习所”,作者“StartupBoy ”
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则