ПРОГРАММНЫЙ КОНВЕЙЕР ПРЕДСКАЗАНИЯ ВЛИЯНИЯ МУТАЦИЙ НА СТАБИЛЬНОСТЬ ПРОСТРАНСТВЕННЫХ СТРУКТУР БЕЛКОВ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ОЦЕНКИ ИЗМЕНЕНИЯ СВОБОДНОЙ ЭНЕРГИИ И ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Авторы: 
Вензель А.С.1,2,3, Иванисенко Т.В.1,2,3, Деменков П.С. 1,2,3, Иванисенко В.А.1,2,3
УДК: 
575.112
DOI: 
10.24412/2073-0667-2024-4-6-16
Аннотация: 

В данной работе был разработан программный конвейер для предсказания влияния мутаций на стабильность пространственной структуры белка. В конвейере применяются комбинированный подход, использующий современные методы искусственного интеллекта для предсказания структуры белка, и классические алгоритмы оценки изменения свободной энергии. Конвейер включает в себя предсказание структуры белка с помощью модели ESM3 и последующий расчет изменения свободной энергии мутантных форм с помощью pyRosetta. Такой подход позволяет преодолеть ограничения существующих методов, объединяя преимущества глубокого обучения и интерпретируемость энергетических расчетов. Разработанный инструмент может найти применение в задачах структурной биоинформатики, биотехнологии и медицины, особенно в условиях ограниченного количества экспериментально определенных структур белков.

 

Работа поддержана бюджетным проектом ИЦиГ СО РАН № FWNR-2022-0020.

Список литературы

  1. Jumper J. и др. Highly accurate protein structure prediction with AlphaFold // Nature. 2021. T. 596. № 7873. C. 583-589.
  2. Abramson J. и др. Accurate structure prediction of biomolecular interactions with AlphaFold 3 // Nature. 2024. C. 1-3.
  3. Baek M. и др. Accurate prediction of protein structures and interactions using a three-track neural network // Science. 2021. T. 373. № 6557. C. 871-876.
  4. Lin Z. и др. Evolutionary-scale prediction of atomic-level protein structure with a language model // Science. 2023. T. 379. № 6637. C. 1123-1130.
  5. Thomas P. J., Qu В. H., Pedersen P. L. Defective protein folding as a basis of human disease // Trends in biochemical sciences. 1995. T. 20. № 11. C. 456-459.
  6. Kellogg E. H., Leaver-Fay A., Baker D. Role of conformational sampling in computing mutation- induced changes in protein structure and stability // Proteins: Structure, Function, and Bioinformatics. 2011. T. 79. № 3. C. 830-838.
  7. Dehouck У. и др. PoPMuSiC 2.1: a web server for the estimation of protein stability changes upon mutation and sequence optimality // BMC bioinformatics. 2011. T. 12. C. 1-12.
  8. Schymkowitz J. и др. The FoldX web server: an online force field // Nucleic acids research. 2005. T. 33. № suppl_2. C. W382-W388.
  9. Montanucci L. и др. DDGun: an untrained method for the prediction of protein stability changes upon single and multiple point variations // BMC bioinformatics. 2019. T. 20. C. 1-10.
  10. Pires D. E. V., Ascher D. B., Blundell T. L. mCSM: predicting the effects of mutations in proteins using graph-based signatures // Bioinformatics. 2014. T. 30. № 3. C. 335-342.
  11. Nikam R. и др. ProThermDB: thermodynamic database for proteins and mutants revisited after 15 years // Nucleic Acids Research. 2021. T. 49, № DI. C. D420-D424.
  12. Xavier J.S. et al. ThermoMutDB: a thermodynamic database for missense mutations // Nucleic Acids Research. 2021. T. 49, № DI. C. D475-D479.
  13. Stourac J. и др. FireProtDB: database of manually curated protein stability data // Nucleic Acids Research. 2021. T. 49, № DI. C. D319-D324.
  14. Cao H. и др. DeepDDG: Predicting the Stability Change of Protein Point Mutations Using Neural Networks //J. Chem. Inf. Model. American Chemical Society, 2019. T. 59, № 4. C. 1508-1514.
  15. Umerenkov D. и др. PROSTATA: a framework for protein stability assessment using transformers // Bioinformatics. 2023. T. 39, № 11. C. btad671.
  16. Pak M. А. и др. Using AlphaFold to predict the impact of single mutations on protein stability and function // Pios one. 2023. T. 18. № 3. C. e0282689.
  17. Mansoor S. и др. Zero-shot mutation effect prediction on protein stability and function using RoseTTAFold // Protein Science. 2023. T. 32, № 11. C. e4780.
  18. Akdel M. и др. A structural biology community assessment of AlphaFold2 applications // Nature Structural & Molecular Biology. 2022. T. 29. № 11. C. 1056-1067.
  19. Burley S.K. и др. RCSB Protein Data Bank (RCSB.org): delivery of experimentally- determined PDB structures alongside one million computed structure models of proteins from artificial intelligence/machine learning // Nucleic Acids Research. 2023. T. 51, № DI. C. D488-D508.
  20. The UniProt Consortium. UniProt: the Universal Protein Knowledgebase in 2023 // Nucleic Acids Research. 2023. T. 51, № DI. C. D523-D531.
  21. Hayes T. и др. Simulating 500 million years of evolution with a language model //bioRxiv. 2024. C. 2024.07. 01.600583.
  22. Frenz В. и др. Prediction of Protein Mutational Free Energy: Benchmark and Sampling Improvements Increase Classification Accuracy // Front. Bioeng. Biotechnol. Frontiers, 2020. T. 8.
  23. Pancotti С. et al. Predicting protein stability changes upon single-point mutation: a thorough comparison of the available tools on a new dataset //Briefings in Bioinformatics. 2022. T. 23. № 2. C. bbab555.
  24. Chaudhury S., Lyskov S., Gray J.J. PyRosetta: a script-based interface for implementing molecular modeling algorithms using Rosetta // Bioinformatics. 2010. T. 26, № 5. C. 689-691.
  25. Alford R. F. и др. The Rosetta all-atom energy function for macromolecular modeling and design // Journal of chemical theory and computation. 2017. T. 13. № 6. C. 3031-3048.
  26. Zhang Y., Skolnick J. TM-align: a protein structure alignment algorithm based on the TM-score //Nucleic acids research. 2005. T. 33. № 7. C. 2302-2309.
  27. Kunzmann P., Hamacher K. Biotite: a unifying open source computational biology framework in Python // BMC Bioinformatics. 2018. T. 19, № 1. C. 346.
Ключевые слова: 
предсказание структуры белка, стабильность структуры белка, молекулярное моделирование, ESM3.
Номер журнала: 
4(65) 2024 г.
Год: 
2024
Адрес: 
1 Институт цитологии и генетики СО РАН, 630090, Новосибирск, Россия 2 Курчатовский геномный центр ИЦиГ СО РАН, 630090, Новосибирск, Россия 3 Новосибирский государственный университет, 630090, Новосибирск, Россия
Библиографическая ссылка: 
Вензель А. С., Иванисенко Т. В., Деменков П. С., Иванисенко В. А. Программный конвейер предсказания влияния мутаций на стабильность пространственных структур белков с использованием методов оценки изменения свободной энергии и искусственного интеллекта //"Проблемы информатики", 2024, № 4, с.6-16. DOI: 10.24412/2073-0667-2024-4-6-16. - EDN: EAMKIP