ТОМСК, 15 февраля. /ТАСС/. Ученые Томского государственного университета (ТГУ) впервые в России научили нейросети генерировать модели образцов биоматериала со специфическими химическими соединениями, характерными для того или иного заболевания. Это позволяет расширить библиотеку данных для обучения компьютерной модели и автоматической диагностики проб, чтобы создавать новые эффективные подходы к диагностике заболеваний сообщили ТАСС в пресс-службе вуза.
Отмечается, что особенность задач биоинформатики заключается в ограниченности количества данных, но при этом их размерность очень большая. С точки зрения вычислительной математики эта задача считается трудноразрешимой. В такой ситуации может помочь машинное обучение. Одним из его направлений являются генеративные сети, которые могут создавать контент при помощи искусственного интеллекта.
«Такие нейросети все чаще используют для написания текстов, генерации картинок, музыки, видео. Но ученые ТГУ ставят перед ИИ гораздо более сложные задачи. Они применяют его для создания моделей данных, которые имитируют различные заболевания. Например, проб выдыхаемого воздуха у пациентов, страдающих раком легких. <…> Ученые ТГУ первыми в России использовали возможности ИИ для генерации столь сложного контента», — сказано в сообщении.
Поясняется, что набрать сотни или тысячи пациентов с одинаковым диагнозом, чтобы на основе взятых у них проб сформировать библиотеку данных для машинного обучения, крайне сложно. Поскольку больших наборов данных нет, ученые ТГУ привлекают физические принципы, например, берут физические уравнения, описывающие работу диагностических приборов, добавляют информацию о специфических молекулах-маркерах заболеваний и на основе этого создают правила, как искусственный интеллект должен генерировать новые данные.
«Это позволяет нам увеличивать обучающие выборки, за счет чего повышается точность и качество моделей машинного обучения, а значит и открывает новые перспективы диагностики», — приводятся в сообщении слова сотрудника лаборатории лазерного молекулярного имиджинга и машинного обучения ТГУ Дениса Вражнова.
Отмечается, что для того, чтобы правильно поставить задачу нейросети, нужны знания на стыке нескольких направлений — математики, физики, биологии и IT. В противном случае можно получить нейросети, которые будут выдавать ошибочные модели проб. Ученые планируют активно развивать данное направление. Следующая задача, которую они планируют решать с помощью генеративных нейросетей — это создание моделей для исследования крови для диагностики онкологических и нейродегенеративных заболеваний.
Источник публикации ТАСС