ПРОГРАММНЫЙ КОНВЕЙЕР ПРЕДСКАЗАНИЯ ВЛИЯНИЯ МУТАЦИЙ НА СТАБИЛЬНОСТЬ ПРОСТРАНСТВЕННЫХ СТРУКТУР БЕЛКОВ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ОЦЕНКИ ИЗМЕНЕНИЯ СВОБОДНОЙ ЭНЕРГИИ И ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
В данной работе был разработан программный конвейер для предсказания влияния мутаций на стабильность пространственной структуры белка. В конвейере применяются комбинированный подход, использующий современные методы искусственного интеллекта для предсказания структуры белка, и классические алгоритмы оценки изменения свободной энергии. Конвейер включает в себя предсказание структуры белка с помощью модели ESM3 и последующий расчет изменения свободной энергии мутантных форм с помощью pyRosetta. Такой подход позволяет преодолеть ограничения существующих методов, объединяя преимущества глубокого обучения и интерпретируемость энергетических расчетов. Разработанный инструмент может найти применение в задачах структурной биоинформатики, биотехнологии и медицины, особенно в условиях ограниченного количества экспериментально определенных структур белков.
Работа поддержана бюджетным проектом ИЦиГ СО РАН № FWNR-2022-0020.
Список литературы
- Jumper J. и др. Highly accurate protein structure prediction with AlphaFold // Nature. 2021. T. 596. № 7873. C. 583-589.
- Abramson J. и др. Accurate structure prediction of biomolecular interactions with AlphaFold 3 // Nature. 2024. C. 1-3.
- Baek M. и др. Accurate prediction of protein structures and interactions using a three-track neural network // Science. 2021. T. 373. № 6557. C. 871-876.
- Lin Z. и др. Evolutionary-scale prediction of atomic-level protein structure with a language model // Science. 2023. T. 379. № 6637. C. 1123-1130.
- Thomas P. J., Qu В. H., Pedersen P. L. Defective protein folding as a basis of human disease // Trends in biochemical sciences. 1995. T. 20. № 11. C. 456-459.
- Kellogg E. H., Leaver-Fay A., Baker D. Role of conformational sampling in computing mutation- induced changes in protein structure and stability // Proteins: Structure, Function, and Bioinformatics. 2011. T. 79. № 3. C. 830-838.
- Dehouck У. и др. PoPMuSiC 2.1: a web server for the estimation of protein stability changes upon mutation and sequence optimality // BMC bioinformatics. 2011. T. 12. C. 1-12.
- Schymkowitz J. и др. The FoldX web server: an online force field // Nucleic acids research. 2005. T. 33. № suppl_2. C. W382-W388.
- Montanucci L. и др. DDGun: an untrained method for the prediction of protein stability changes upon single and multiple point variations // BMC bioinformatics. 2019. T. 20. C. 1-10.
- Pires D. E. V., Ascher D. B., Blundell T. L. mCSM: predicting the effects of mutations in proteins using graph-based signatures // Bioinformatics. 2014. T. 30. № 3. C. 335-342.
- Nikam R. и др. ProThermDB: thermodynamic database for proteins and mutants revisited after 15 years // Nucleic Acids Research. 2021. T. 49, № DI. C. D420-D424.
- Xavier J.S. et al. ThermoMutDB: a thermodynamic database for missense mutations // Nucleic Acids Research. 2021. T. 49, № DI. C. D475-D479.
- Stourac J. и др. FireProtDB: database of manually curated protein stability data // Nucleic Acids Research. 2021. T. 49, № DI. C. D319-D324.
- Cao H. и др. DeepDDG: Predicting the Stability Change of Protein Point Mutations Using Neural Networks //J. Chem. Inf. Model. American Chemical Society, 2019. T. 59, № 4. C. 1508-1514.
- Umerenkov D. и др. PROSTATA: a framework for protein stability assessment using transformers // Bioinformatics. 2023. T. 39, № 11. C. btad671.
- Pak M. А. и др. Using AlphaFold to predict the impact of single mutations on protein stability and function // Pios one. 2023. T. 18. № 3. C. e0282689.
- Mansoor S. и др. Zero-shot mutation effect prediction on protein stability and function using RoseTTAFold // Protein Science. 2023. T. 32, № 11. C. e4780.
- Akdel M. и др. A structural biology community assessment of AlphaFold2 applications // Nature Structural & Molecular Biology. 2022. T. 29. № 11. C. 1056-1067.
- Burley S.K. и др. RCSB Protein Data Bank (RCSB.org): delivery of experimentally- determined PDB structures alongside one million computed structure models of proteins from artificial intelligence/machine learning // Nucleic Acids Research. 2023. T. 51, № DI. C. D488-D508.
- The UniProt Consortium. UniProt: the Universal Protein Knowledgebase in 2023 // Nucleic Acids Research. 2023. T. 51, № DI. C. D523-D531.
- Hayes T. и др. Simulating 500 million years of evolution with a language model //bioRxiv. 2024. C. 2024.07. 01.600583.
- Frenz В. и др. Prediction of Protein Mutational Free Energy: Benchmark and Sampling Improvements Increase Classification Accuracy // Front. Bioeng. Biotechnol. Frontiers, 2020. T. 8.
- Pancotti С. et al. Predicting protein stability changes upon single-point mutation: a thorough comparison of the available tools on a new dataset //Briefings in Bioinformatics. 2022. T. 23. № 2. C. bbab555.
- Chaudhury S., Lyskov S., Gray J.J. PyRosetta: a script-based interface for implementing molecular modeling algorithms using Rosetta // Bioinformatics. 2010. T. 26, № 5. C. 689-691.
- Alford R. F. и др. The Rosetta all-atom energy function for macromolecular modeling and design // Journal of chemical theory and computation. 2017. T. 13. № 6. C. 3031-3048.
- Zhang Y., Skolnick J. TM-align: a protein structure alignment algorithm based on the TM-score //Nucleic acids research. 2005. T. 33. № 7. C. 2302-2309.
- Kunzmann P., Hamacher K. Biotite: a unifying open source computational biology framework in Python // BMC Bioinformatics. 2018. T. 19, № 1. C. 346.