02.03.2021

Российские ученые создали модель для ускоренной разработки лекарств

Российские ученые создали модель для ускоренной разработки лекарств

Исследователи из МГУ создали модель, которая генерирует 90% химически валидных лекарственных соединений, способных связываться с заданным белком, используя лишь его аминокислотную последовательность. Разработка, которая позволит ускорить и упростить процесс создания новых препаратов, описана в статье, опубликованной в журнале Scientific Reports

Разработка лекарственных препаратов — длительный и дорогостоящий процесс. Одним из его ключевых этапов является поиск молекулы, способной воздействовать на белок-мишень, и сейчас активно изучается возможность решения этой задачи с помощью методов машинного обучения.

Ученые использовали глубокую нейронную сеть «Трансформер», созданную в 2017 году для обработки естественного языка, и состоящую из энкодера и декодера. Энкодер отображает входную последовательность символов в некоторый вектор, а декодер, используя его, посимвольно генерирует на выходе последовательность.

Уникальной особенностью сети являются self attention-слои. Self attention — это механизм внимания, который устанавливает связи между разными участками последовательности, и на основании этих данных строит ее представление. Российские ученые в качестве слов использовали аминокислоты и отдельные символы строкового представления молекулы (SMILES). Благодаря этому им удалось адаптировать одну из самых успешных архитектур в области машинного перевода к задачам генерации молекул: оказалось, что аминокислотной последовательности белка достаточно для того, чтобы сгенерировать молекулы, связывающиеся с заданным белком.



СМОТРИТЕ ТАКЖЕ