Отвечаем на вопросы про биоинформатику
Есть ли примеры применения искусственных нейронных сетей (в широком смысле — machine learning) для решения задач биоинформатики (в узком смысле — решения задач поиска новых более действенных лекарственных средств). Если можно — ссылки на литературу или пару статей.
Виктор Абруков
ЧувГУ, завкаф
Илья Корвиго
Научный сотрудник в МФТИ, аспирант ИТМО, биоинформатик в Ксивелью
Отвечает
Машинное обучение применяется уже в тысячах биологических статей, вот примеры из разных областей:
- структурная биология (Support Vector Machines for predicting protein structural class),
- аннотация геномов (OrfM: a fast open reading frame predictor for metagenomic data),
- предсказание эффекта мутаций в медицинской генетике (Predicting functional effect of human missense mutations using PolyPhen-2),
- моделирование структуры микробных сообществ (Longitudinal Prediction of the Infant Gut Microbiome with Dynamic Bayesian Networks),
- анализ текстов статей (Term identification in the biomedical literature).

Искусственные нейронные сети, такие как многослойный перцептрон (MLP), тоже используются нередко. Правда, под нейронными сетями сейчас чаще понимают не MLP, а глубокие рекуррентные и сверточные сети. Их популярности способствует развитие аппаратного ускорения и накопление больших данных (big data). Работы с применением таких сетей встречаются в основном в тех областях, где накоплено достаточно данных.

Рекуррентные сети широко используются для автоматического анализа текстов статей (Deep learning with word embeddings improves biomedical named entity recognition). Это важно, если для анализа нужны данные из тысяч статей — сам прочитать не успеешь. Области применения:
- поиск эффектов влияния малых молекул (лекарств) на целевые молекулы и организм,
- поиск связей между генотипом и фенотипом.

А сверточные сети способны создавать обобщенные иерархические детекторы пространственных структур, поэтому все чаще используются в структурной биологии. Примеры:
- моделирование ДНК-белковых взаимодействий (Convolutional neural network architectures for predicting DNA-protein binding),
- докинг белков с лекарственными препаратами (Protein-Ligand Scoring with Convolutional Neural Networks).
comments powered by HyperComments
Наши контакты
Телефон: +7 916 088 13 07
E-mail: hello@ksivalue.com
ООО «Ксивелью»
ИНН 7702424959, ОГРН 5177746030831
Москва, Ленинский проспект, 30А. Схема проезда