Применение методов машинного обучения для предсказания сердечно-сосудистых заболеваний па малых наборах данных
Благодаря увеличению вычислительной мощности и генерации больших объемов данных алгоритмы искусственного интеллекта в настоящее время активно используются для выполнения широкого круга медицинских задач. Одна из важнейших областей, в которых может быть полезно применение искусственного интеллекта, в частности, методов машинного обучения, – это диагностика заболеваний и прогнозирование их возможных исходов. В настоящей статье описывается процесс использования алгоритмов машинного обучения для предсказания риска развития неблагоприятных сердечно-сосудистых событий у пациентов с диагностированной артериальной гипертензией в ближайшие 12, 24 и 36 месяцев. Отличительной чертой данной задачи является использование в качестве обучающего дата-сета локальных данных, собранных в отдельном регионе РФ. Данная особенность может улучшить адаптированность предсказательной модели к возможным локальным особенностям развития сердечно-сосудистых заболеваний, однако и имеет существенный недостаток – малое количество обучающих данных. В работе рассмотрена одна из возможных формальных математических постановок рассматриваемой задачи, указаны этапы формирования дата-сета и исследованы предсказательные алгоритмы машинного обучения на малых наборах для создания модели расчета рисков сердечно-сосудистых заболеваний. Представленные результаты позволяют говорить о возможности использования моделей машинного обучения для повышения точности прогнозирования сердечно-сосудистых рисков.