Protein Design with Guided Discrete Diffusion
N Gruver, S Stanton, N C. Frey, T G. J. Rudner, I Hotzel, J Lafrance-Vanasse, A Rajpal, K Cho, A G Wilson
[New York University & Genentech]
基于引导离散扩散的蛋白质设计
-
动机:传统的蛋白质设计方法在优化离散序列方面存在困难,而现有的基于结构的方法也有数据稀缺和逆向设计的挑战。本文旨在提出一种离散扩散模型的引导方法,直接在序列空间进行设计,克服了结构搜索的限制。 -
方法:引入diffusioN Optimized Sampling(NOS)作为一种离散扩散模型的引导方法,通过在去噪网络的隐状态中遵循梯度来进行离散序列的设计。同时,将NOS与LaMBO相结合,提出了LaMBO-2,一种适用于序列设计的贝叶斯优化过程,支持多目标和基于编辑的约束。 -
优势:NOS方法使得在离散序列空间中进行设计成为可能,避免了结构方法的数据稀缺和逆向设计的限制。LaMBO-2通过引入显著性图的新应用,实现了离散扩散和有限编辑的更强大性能。在真实的蛋白质设计任务中,LaMBO-2在局部性和可行性约束下优化抗体,实现了97%的表达率和25%的结合率。
提出了一种离散扩散模型的引导方法,结合显著性图的编辑方式,实现了在蛋白质设计中的性能提升和优化目标的控制。
https://arxiv.org/abs/2305.20009
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...