近日,微生物代谢全国重点实验室鲁洪中副教授与华东理工大学生物反应器工程全国重点实验室王冠副教授合作在国际期刊《Nature Communications》发表了题为"EnzymeTuning Improves Enzyme-constrained Metabolic Modeling and Proteome Abundance Prediction Through Deep Learning"的研究论文。该研究创新性地提出了名为EnzymeTuning的计算框架,率先将生成对抗网络(GAN)引入酶约束基因组尺度代谢模型(ecGEMs)的全局优化,为构建高精度的"数字细胞"提供了新方法。上海交通大学与华东理工大学联合培养博士生王雪婷为论文第一作者,鲁洪中副教授与华东理工大学王冠副教授为共同通讯作者。
痛点:当"体外数据"遇上"细胞内真实世界"
如果把细胞比作一座24小时不停歇的精密工厂,那么数千种酶就是各司其职的"分子工人"。为了在计算机中模拟这座工厂的运转,科学家们构建了酶约束基因组尺度代谢模型(ecGEMs)。它将细胞内所有已知代谢反应编织成一张网络,并加入酶催化能力的限制,从而预测细胞的生长与蛋白质资源分配。然而,这套系统的"卡脖子"环节在于一个关键参数—酶周转数(kcat),它代表单个酶分子单位时间内的催化效率。目前kcat数据绝大多数来自体外实验,而细胞内部环境非常复杂。这种"体外-体内"的差距常导致模型严重失真。某些酶丰度被严重高估;与此同时,一些实际存在的酶丰度却被预测为零,如同隐形了一般。传统的参数修正方法大多依赖人工经验或局部的启发式调整,不仅计算成本高昂,更难以协调数千个酶参数之间的全局平衡。
破局:让AI学会"统筹全局",拓展模型认知
针对这一瓶颈,研究团队构建了EnzymeTuning框架,其核心策略是将生成对抗网络(GAN)与代谢模型深度融合,把逐个修正酶参数的传统思路,转变为全局优化参数分布的新范式(图1)。整个过程如同训练一位既懂生化反应网络又精通统筹学的"AI调度员"。首先,基于现有kcat参数分布生成多组候选参数集,结合细胞生长表型和蛋白质丰度实验数据,筛选出高性能组合。随后,条件生成对抗网络学习这些优质参数的分布规律,批量生成新的kcat参数。最后,将新生成的参数重新代入ecGEMs进行多轮迭代评估。经过这一系列操作,EnzymeTuning输出的不再是孤立的数值修补,而是服从细胞整体生理状态的协同优化方案。
在优化过程中,研究团队发现了一个有趣的现象:即使经过kcat调优,仍有部分在实验中明确检测到的蛋白质在模型预测中消失了。研究团队将这类真实存在于细胞却因模型本身结构问题而被系统忽略的成分命名为"暗蛋白"(dark proteins)。为了照亮这些暗区,团队创新性地引入蛋白质合成速率(Vsyn)约束,即利用文献报道的蛋白质降解常数反推合成速率,并将其嵌入模型。这一改进使模型可预测的酶数量增加至约400个(以酿酒酵母ecGEMs为例计算),同时显著减少了极端酶数量预测偏差。这意味着ecGEMs的"视野"被大幅拓宽,从只关注高活性明星酶转向兼顾更多低调但必需的"分子工人",实现了更趋近于真实细胞的全局蛋白质资源分配预测。

图 1 EnzymeTuning整体框架:基于GAN策略的ecGEMs中kcat全局优化流程
验证:跨越物种建模效果测试
一个优秀的计算框架,必须具备良好的跨物种适用性。为此,研究团队将EnzymeTuning扩展至乳酸克鲁维酵母、马克思克鲁维酵母、解脂耶氏酵母等三种非模式酵母与原核生物大肠杆菌(图2)。结果显示,经EnzymeTuning所优化的ecGEMs在非模式酵母中同样展现出更高的预测精度和更合理的酶资源分配模式。在大肠杆菌中,蛋白质丰度预测值与实验值的皮尔森相关性系数从0.37跃升至0.47,极端偏差酶数量中位数从41个锐减至20个。这些数据表明,EnzymeTuning可适用于各类底盘ecGEMs构建与优化,并明显提升非模式物种ecGEMs的预测性能。

图 2 EnzymeTuning在三种非模式酵母中的跨物种验证
应用:从模型优化到细胞工厂设计
经过EnzymeTuning校准的模型,不仅能算得更准,而且有助于从组学数据中提炼新的生物学见解。如在氮限制条件下,酵母ecGEMs可精准捕捉到细胞主动降低脂质合成等高能耗过程,同时增强氮回收和氧化还原平衡相关酶的利用,这其实是一套精密的经济紧缩策略。在厌氧条件下,经EnzymeTuning优化的ecGEMs可以推断出更加符合生理实际的连续通量分布。在代谢工程实践中,以苏氨酸生产为例,优化后的大肠杆菌模型识别出28个潜在工程靶点(传统方法仅识别20个),既包括合成通路核心酶(HOM3、HOM2、THR1),也涵盖了前体供应关键节点(PYC1)。这意味着,工程师们可以基于更精准的数字细胞,做出更可靠的理性设计决策,减少实验试错成本。
该研究通过将生成对抗网络与酶约束代谢模型深度融合,在系统尺度上实现了酶动力学参数的全局优化,显著提升了代谢模型对蛋白质丰度的预测能力。EnzymeTuning在不同物种、不同营养条件、不同环境条件下均表现出稳定的收敛性与良好的泛化能力,不仅能够提升模型预测精度,所校准的模型还可揭示具有生物学意义的酶资源分配模式。该框架为代谢工程和合成生物学提供了一种高效、可靠的细胞代谢数字化建模工具。目前,EnzymeTuning完整代码与使用文档已在GitHub平台开源(https://github.com/hongzhonglu/EnzymeTuning),供全球研究者免费获取。随着多组学数据的积累和算法的迭代,该框架有望整合转录组、代谢组等更多维度的信息,并拓展至CHO细胞等哺乳动物培养系统,在生物制药与工业生物技术领域发挥更大作用。
该研究工作得到了国家重点研发计划、国家自然科学基金、上海市重大科技专项、上海市基础研究"探索者"计划、上海市自然科学基金及江苏省科技重大专项等多项目资助。
论文链接: https://www.nature.com/articles/s41467-026-73744-3