在医疗创投行业,一笔10亿级美元以上的融资,往往要在企业发展的中后期才能出现。
而在近期,一家医疗创新企业刚刚走出隐匿模式,便宣告拿下超10亿美元融资,成为截至目前2024年全球最大医疗种子轮,也让这家企业一跃成为独角兽。
要知道,种子轮往往是创业公司获得的第一笔重要资金,由于此时项目十分初创,平均融资额大致在数十万至数百万美元之间。10亿美元以上融资额的医疗种子轮,极其稀少,目前全球仅两例(另一例是抗衰老企业Altos Labs在2022年获得的30亿美元融资)。
此次拿下超10亿美元种子轮的企业名为XAIra Therapeutics,由生物技术领域最大的投资机构之一ARCH Venture Partners和Foresite Labs于2023年5月联合孵化。据官网介绍,Xaira Therapeutics核心业务方向是利用AI重塑药物研发,目前专注蛋白质组学方向,即研究蛋白质如何在健康和疾病中发生变化。
与业务方向密切相关,这家企业的联合创立者为2021年科学突破奖·生命科学奖(该奖被誉为“科学界的奥斯卡”)获得者、华盛顿大学蛋白质设计研究所所长David Baker,其与团队研发的新技术,能够设计在自然界中从未见过的蛋白,包括一些对于人类疾病具有干预性治疗潜力的新型蛋白。
其实,在“AI+蛋白质”,Xaira Therapeutics的融资不是孤例。据动脉橙数据库,2022年1月至2024年6月的两年半间,该赛道已发生不下100起融资事件,总融资额超60亿美元,是目前医疗健康最受资本热捧的领域之一。
(数据来源:动脉橙数据库)
频获融资背后,“AI+蛋白质”赛道究竟讲出了一个什么样的产业新故事?
超豪华阵容+超10亿美元加持,Xaira Therapeutics具体要做什么?
在当下,“AI+蛋白质”正成为科技行业关注的焦点。
原因在于,传统的蛋白质研究方法存在着实验周期长、成本高昂等问题,而AI能够加速蛋白质研究进程:一旦用于药物研发,可助力新靶点的发现,缩短研发周期和降低时间成本,而用于材料,则以生成超越自然界的新蛋白质材料,为农业食品等领域带来新增量。
(Al+蛋白质行业的发展大事件 图片来源:智药局·《AI+蛋白质行业研究报》)
正是在巨大的想象空间下,“AI+蛋白质”赛道开启狂奔征途。但要想入局,并不容易——其一,要满足足够的研发资金;其二,要有强大的团队。
前者,Xaira Therapeutics已经拿下超10亿美元;后者,Xaira Therapeutics更是拥有一个强大的跨学科团队,成员囊括计算机科学、生物信息学、数据科学、药理学、商业管理等行业背景的专业人才。比如担任CEO的是Marc Tessier-Lavigne博士,其曾是基因泰克首席科学官,同时也是洛克菲勒大学和斯坦福大学前校长。
更重要的是,前文提到的联合创立者David Baker,是“AI+蛋白质”领域大牛级的人物。据悉,Xaira Therapeutics的大部分技术来自David Baker及其任职的华盛顿大学蛋白质设计研究所。
因此,要深入了解Xaira Therapeutics,就需要知晓David Baker及其团队的研究成果。纵观David Baker的科研经历,其一直专注在蛋白质结构预测和蛋白质设计方向。
● 在蛋白质结构预测方 向,David Baker及其团队早在1998年便推出了Rosetta算法,并在第三届国际蛋白质结构预测大赛中崭露头角。随着后续的不断优化,Rosetta在蛋白质结构预测领域一直是最具代表性的算法之一,并陆续开发出多种临床阶段蛋白质生物制剂、多款IND 阶段分子和十多种临床前阶段生物制剂。
●在蛋白质设计方向,David Baker及其团队在2022年推出了深度学习工具ProteinMPNN,其借鉴了图像识别使用的神经网络,能够明确与特定结构相对应的序列,可以更加精准、快速地设计蛋白质分子,将设计蛋白质的时间长度从“月”缩短至“秒”,比此前最好的软件快200多倍。
据悉,Xaira Therapeutics所用的AI大模型,就整合了David Baker及其团队开发的AI大模型RFdiffusion,后者是该团队继ProteinMPNN后,推出的一种更先进、更通用的蛋白质设计模型。
具体来说,RFdiffusion是利用扩散模型构建的创新型生成式AI系统,其类似Midjourney和Stable Diffusion等能将文本生成图像的模型,即可以生成新颖的、可定制的蛋白质“骨架”(即蛋白质的整体结构支架),然后将序列分层。据外媒报道,该模型可按需设计生物分子,有望革新疫苗和药物开发领域。
不过,由于尚处初创阶段,Xaira Therapeutics并未透露太多研发进展和管线布局,外界还难以预判其未来的具体动作。
但可以肯定的是,凭借强大的明星创始团队和巨额融资,Xaira Therapeutics一出场已经成为“AI+蛋白质”赛道最重磅的选手之一。
资本热捧,“AI+蛋白质”赛道进展几何?
“AI+蛋白质”的创投大浪潮始于2020年。
彼时,由Google DeepMind团队开发的AlphaFold成功预测出蛋白质的三维结构,迈出了利用人工智能预测蛋白质结构的第一步,使“AI+蛋白质”成功破圈,并吸引众多创业者和投资机构入局。
“这是人工智能对科学领域最大的一次贡献,也是人类在21世纪取得的最重要的科学突破之一。”谈及AlphaFold,西湖大学校长施一公曾如此表示。
从技术角度看,“AI+蛋白质”赛道可以分为三大主要方向,分别是AI蛋白质组学、AI蛋白质预测与AI蛋白质设计,其区别如下:
● AI蛋白质组学:蛋白质组学是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学,AI与蛋白质组学的结合,能够在靶点发现、生物标志物的发现和精准医疗领域有很大应用潜力。
● AI蛋白质预测:通过机器学习和深度学习算法,基于蛋白质的氨基酸序列信息,预测蛋白质的三维结构、折叠方式和与其他分子的相互作用。
● AI蛋白质设计:利用AI在没有人类直接干预的情况下,通过学习蛋白质序列和功能之间的关系,设计出新的蛋白质。
接下来,我们将从三个方向看各自的代表企业与其进展。不过需要注意的是,蛋白质预测和蛋白质设计都是紧紧围绕“蛋白质如何折叠”这一核心命题展开研究,所以一些创新企业在两个方向上皆有布局。
目前,在AI蛋白质组学方向,已经有珞米科技、Matchpoint、Olink、Somalogic、西湖欧米(按企业名称首字母排序)等为代表创新企业。
以西湖欧米为例,其成立于2020年7月,主要聚焦开发和应用以蛋白质谱为主的多组学技术,并通过该技术正在推进甲状腺结节、阿尔茨海默病(老年痴呆症)、肺癌等多种疾病的体外诊断试剂和方法的开发。
例如,针对甲状腺结节的检测,西湖欧米通过蛋白质组结合AI技术,开发出新型分子诊断产品“甲谱诺”。该产品能够将结节良恶性诊断的准确率提升到90%左右,从而帮助大部分原本难以判断良恶性的患者免受手术之苦。
又比如总部位于瑞典的Olink,该企业提供了一个以蛋白质组学为中心的产品和服务平台,其中最著名的是其邻位延伸分析(PEA)技术——该技术可在实验室安装的qPCR仪器和下一代测序仪上运行,带来高通量蛋白质分析能力。据悉,PEA技术建立在超过5300个蛋白质生物标志物目标的庞大文库上,已经在约1400份科学论文中得到应用,显示了其强大的市场潜力和科研价值。
就在7月10日,全球科学服务领域的巨头赛默飞宣布对Olink进行收购,收购总金额高达31亿美元。赛默飞总裁兼首席执行官Marc Casper在声明中提到:“收购Olink凸显了蛋白质组学在推进生命科学研究和精准医疗方面的深远影响。”
在AI蛋白质预测方向,涌现了百图生科、DeepMind、分子之心、GenesisTherapeutics、华深智药、Profluent Bio、深势科技、天壤(按企业名称首字母排序)等代表企业。
作为AI蛋白质预测领域的先行者,继AlphaFold后,DeepMind于去年发布了又一AI模型AlphaMissense。根据国外媒体的报道,AlphaMissense通过利用蛋白质序列数据库和变异结构背景,可以识别致病的错义突变(错义突变是可能破坏人类蛋白质功能的基因突变)和未知致病基因,且可预测的范围比人类专家提升近千倍。
同时,在今年5月,DeepMind与AI 药物发现公司Isomorphic Labs共同宣布推出新一代AI生物分子结构模型AlphaFold 3,其开发建立在AlphaFold 2 的基础之上,能将预测范围从蛋白质带到广泛的生物分子。
(AlphaFold3预测的分子结构 图片来源:DeepMind)
国内企业天壤推出了xCREATOR工作台,其通过集成多样化的AI算法和计算资源,为科研院所、企业等提供更高效、更便捷、更易用的蛋白质结构预测与设计服务。用户无需编写任何代码即可进行蛋白质预测和设计等各项任务,并对计算结果进行可视化展示和分析,适用于多肽、酶、抗体和各类功能蛋白质。
借助工作台,使用者几分钟内就可以获得接近实验解析精度的蛋白质结构。在过去,这个时间可能是数个月甚至数年,并且得借助造价昂贵的专业器械。
在AI蛋白质设计方向,已经跑出Arzeda、Cradle Bio、分子之心、Generate Biomedicines、RevolKa、天壤、天鹜科技、途深智合等(按企业名称首字母排序)企业。
国外企业Generate Biomedicines是该方向的代表企业之一,其由生命科学顶级风投公司Flagship Pioneering孵化,开发了名为Chroma的生成式人工智能模型,该模型建立在扩散模型(Diffusion Models)和图神经网络(Graph Neural Networks)的框架上,能够从头生成高质量、多样化和创新的蛋白质结构。
在落地应用上,目前Generate Biomedicines已经拥有广泛的产品管线,涵盖免疫学、肿瘤学和传染病学。
再看国内企业分子之心,该企业自主研发了产业级AI蛋白质生成大模型——NewOrigin(达尔文)大模型,该模型拥有百亿级参数,学习了海量高度专业、复杂的多模态数据,可根据产业应用需求,“按需定制”功能性蛋白质。
截至目前,分子之心已将NewOrigin大模型广泛应用于创新药研发、新材料、食品、化工、农业等领域,在大分子药物设计、极端环境下蛋白质稳定性优化、酶活性优化、酶-特定底物对接、蛋白质从头设计等多类型的高难度产业任务上取得重大突破,并在真实的生产体系中获得验证。
不难发现,在各个细分方向,创新企业们已经取得重要突破,并正持续深入中。
后续,得益于更多企业的进入与新的可能性产生,“AI+蛋白质”在行业端的应用会迎来更大进展,市场空间将不断拓宽。据MedMarket Insights测算,2023年AI蛋白质市场规模已达14.83亿美元,预计到2031年市场规模将增长至178亿美元,年复合增长率约为36.5%。
(“AI+蛋白质”市场规模预测 图片来源:智药局·《AI+蛋白质行业研究报》)
水大,鱼就可能大。在不断拓宽的想象空间里,“AI+蛋白质”赛道势必走出全球性的巨头企业。
向挑战发起冲锋,“AI+蛋白质”的未来正在到来
前路很美好,但同时也要注意,“AI+蛋白质”赛道仍面临着一些落地挑战。
比如《AI+蛋白质研究报告》就指出,数据质量问题是AI应用中的一个关键限制因素,由于蛋白质结构的复杂性,所以需要大量高质量的数据来训练和验证AI模型。目前,尽管如PDB(蛋白质数据银行)公共数据库提供了大量结构信息,但这些数据往往存在偏差和不完整性,这可能影响AI模型的准确性和泛化能力。
此外,哥伦比亚大学助理教授Mohammed AlQuraishi在接受《Nature Biotechnology》采访时表示,从设计具有特定分子功能的蛋白质到了解它们如何在人和生物体内运作,在这一过程中,生物学的全部复杂性会成为限制性步骤。
当然,任何事都有两面性,挑战的背后即是机遇——作为生命体中最为基础的组成部分之一,在AI加持下,蛋白质相关应用或能在接下来数年内在更多细分领域落地,带来巨大商业可能性。
目前,包括Meta(原Facebook)、英伟达等行业巨头已经跨越到“AI+蛋白质”领域,意欲通过学习大量数据来研发设计蛋白质的模型。而当越来越多的企业加入该赛道,相关研究成果的论文层出不穷,且持续加速,行业很有可能在某个时间节点迎来巨大突破。
相信,随着行业入局者们迎难而上,解决一个又一个挑战,“AI+蛋白质”赛道将讲出更为性感的故事,从而为医疗创新行业带来更大可能。
在这个过程中,那些不断创新求索的企业,也终将获得属于它们的丰硕回报。
参考资料
《AI+蛋白质行业研究报告》——智药局
本文来自微信公众号“动脉网”(ID:vcbeat),作者:胡煊
发评论,每天都得现金奖励!超多礼品等你来拿
登录 后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则