AI 在分子胶发现中能做什么、不能做什么

过去 2-3 年,几乎每家分子胶 Biotech / CRO 都会在 PPT 上写「AI 驱动」「AI 平台」。作为一个在分子胶项目上真实使用 AI 工具、并把 AI 模块作为 PRODED 平台核心的团队,我们想给一个相对务实的清单:分子胶领域 AI 真正能做什么、不能做什么。

AI 真正能做的

1. 靶蛋白可降解性预测

这是 AI 当前最成熟的应用。给定一个靶蛋白序列 / 结构,预测它在 CRBN / VHL 等 E3 系统下能否被降解。准确率在 75-85% 范围内,已经能用于立项决策。

2. 三元复合物结构预测

AI 几何采样 + 物理力场打分的混合方法,能比纯 MD 模拟快 100 倍以上。在合成前预筛分子骨架的几何可行性,是 PRODED 平台模块 2 的核心。

3. SAR 数据驱动的活性预测

当一个项目积累了几百到几千个 SAR 数据点后,用 AI 拟合「分子结构 → 活性」的回归关系,指导下一轮设计——这是非常成熟的应用。多数 Biotech 内部都在用。

4. 高通量虚拟筛选

从百万到千万级化合物库中筛出几百个候选,用计算成本省下湿实验成本。

AI 暂时还做不好的

1. 从零设计全新分子胶

「输入一个靶点,AI 自动输出一个分子胶 PCC」——这是 PPT 里的故事,工业上不能信。原因:分子胶的有效化学空间远比常规小分子稀薄,AI 生成模型在这个稀薄空间内表现差。

2. 替代实验验证

所有 AI 工具的输出都是预测,不是结论。预测可降解的靶点,最终是否真的可降解、化合物是否真有活性、毒性如何,都需要湿实验验证。任何宣称「AI 跳过实验」的,都需警惕。

3. 罕见 E3 系统

CRBN 系统有大量公开数据可训练。但 DCAF15、KEAP1、cIAP 等罕见 E3 数据稀少,AI 模型在这些靶点上表现明显下降。

4. 跨平台迁移

一个公司在 CRBN 上训练的 AI 模型,迁移到 VHL 系统效果会大幅下降。AI 在分子胶领域目前仍高度依赖具体场景的 fine-tuning。

怎么判断一个 CRO 的 AI 能力是否真

  • 问对方 AI 模型是基于多少数据训练的?数据来源?
  • 问对方在内部交叉验证集上的具体性能数字(precision / recall / accuracy)。
  • 问对方 AI 模型有没有支撑过自有项目从立项到 PCC(这是最硬的验证)。
  • 问对方 AI 团队规模 + 计算资源(GPU 集群、算力来源)。

关于 PRODED 平台

具体到我们的 PRODED 平台:模块 1(可降解性预测)支撑了 FD-001、FD-002、FD-003 三个项目的立项决策,模块 2(三元复合物建模)指导了 FD-001 的设计。这两个模块的预测结果与最终实验结果的一致性,是我们对外提供商业服务的底气。了解服务详情