МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ
НОВОСИБИРСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

БИОИНФОРМАТИКА. АЛГОРИТМЫ АНАЛИЗА БОЛЬШИХ БИОЛОГИЧЕСКИХ ДАННЫХ
Двухгодичный образовательный модуль для магистрантов
направления «Прикладная математика и информатика»
О программе
Биоинформатика и системная биология – динамично развивающиеся междисциплинарные области, которые сформировались как отдельные направления из математической биологии в конце ХХ века. К задачам в биоинформатике относят, прежде всего, задачи анализа биологических последовательностей – генетических текстов, получаемых с помощью современных экспериментальных технологий в огромных масштабах (крупнейшие банки генетических данных содержат петабайты информации). Спектр этих задач включает следующие задачи (но не ограничивается ими):
Сборка генетических последовательностей из фрагментов
~10^8 – 10^10 символов в последовательности геномной ДНК, ~10^2 – 10^5 символов в одном фрагменте
Поиск сигналов в генетических последовательностях
Поиск различных функциональных и структурных элементов в последовательностях ДНК, РНК и белков (гены, регуляторные участки, структурные мотивы)
Сравнение генетических последовательностей и поиск в них значимых отличий
Например, сравнение геномов разных организмов, относящихся к одному виду у больных и здоровых организмов
Определение генов, работающих в различных условиях
Например, сравнение геномов, транкриптомов и протеомов, поиск различий, связанных с заболеваниями
В биоинформатике при анализе последовательностей используются преимущественно методы дискретной математики, а также статистического анализа. Для изучения структуры и динамики биологических систем используется математическое моделирование.
Хранение и обработка данных основаны на использовании баз данных и онтологий.
В последнее время биоинформатика вышла за пределы анализа только биологических последовательностей и стала важным инструментом в исследовании других видов биологических данных – научных текстов, изображений (фотографий, микроскопических и томографических снимков), физиологических и биохимических данных, данных ЭЭГ и ЭКГ и многих других.
В этой связи в последние годы в биоинформатике все более активно используются методы машинного обучения и анализа больших данных.
АЛГОРИТМЫ АНАЛИЗА БОЛЬШИХ БИОЛОГИЧЕСКИХ ДАННЫХ
Презентация программы
Дисциплины программы
Программа включает обязательные дисциплины из учебного плана направления «Прикладная математика и информатика» Механико-математического направления НГУ, а также следующие специальные дисциплины, посвященные изучению задач системной биологии и биоинформатики:
Алгоритмы в биоинформатике
Лектор - Афонников Дмитрий Аркадьевич, к.б.н., в.н.с. лаборатории эволюционной биоинформатики и теоретической генетики ИЦиГ СО РАН, доцент кафедры информационной биологии ФЕН НГУ
В курсе будут даны базовые определения из биоинформатики и молекулярной биологии, которые понадобятся для понимания дальнейшего материала образовательной программы. Будет проведен широкий обзор разделов биоинформатики с упором на методы чтения генома, а также на алгоритмы сравнения строк и алгоритмы неточного поиска подпоследовательностей в больших текстах.

14 лекций и 14 семинаров
Генетика в задачах биоинформатики
Лектор - Юшкова Анна Александровна, к.б.н., доцент кафедры естественных дисциплин ВКИ НГУ
Этот курс познакомит обучающихся с основными терминами и современными исследованиями в области генетики. От разбора молекулярного носителя наследственности, молекулы ДНК обучающиеся перейдут к подробному изучению ее функциональных единиц – генов. Обучающиеся научатся решать увлекательные генетические задачи и ориентироваться в причинах и последствиях мутаций, а также узнают законы классической генетики.

16 лекций и 16 семинаров
Введение в анализ данных и машинное обучение в биологии
Лектор - Антонец Денис Викторович, ведущий программист лаборатории моделирования сложных систем Института систем информатики СО РАН
В настоящее время методы машинного обучения все шире используются для решения задач биоинформатики и системной биологии. Умение грамотно обрабатывать данные и извлекать закономерности, строить прогнозы становится критически важным для решения сложных научных и практических задач. Основная цель данного курса – дать студентам подготовку, необходимую для успешного освоения современных методов анализа данных. В рамках курса студенты познакомятся с основами интеллектуального анализа данных, включая преобразование и очистку данных, работу с пропущенными значениями, основными способами визуализации данных (гистограммами, диаграммами плотности, диаграммами рассеяния, ящиками с усами и т.п.), корреляционным анализом, с различными методами отбора признаков, с задачами снижения размерности, кластеризации, классификации, регрессии и с наиболее известными и широко используемыми методами их решения. Студенты познакомятся со специализированными библиотеками для визуализации и анализа данных и научатся применять полученные знания для решения практических задач, в том числе, загружать данные, сохраненные в разных форматах, выбирать и группировать нужные записи по заданным критериям, строить предсказательные модели и оценивать их качество.

16 лекций и 12 семинаров
Компьютерная транскриптомика
Лектор - Землянская Елена Васильевна, к.б.н., с.н.с. сектора системной биологии морфогенеза растений ИЦиГ СО РАН, зав. лабораторией компьютерной транскриптомики и эволюционной биоинформатики (ЛКТиЭБ) ФЕН НГУ
Курс по компьютерной транскриптомике будет включать в себя изучение массового параллельного секвенирования, конвейера для обработки данных массового параллельного секвенирования транскриптомов и конвейерных систем, задачи картирования прочтений на геном, особенностей картирования транскриптомных последовательностей, дифференциальной экспрессии генов и многомерного анализа данных по экспрессии генов. Обучающиеся будут решать задачу сборки транскриптома de novo, а также другие задачи, решаемые с помощью анализа транскриптомных данных.

16 лекций и 16 семинаров
Генетические методы исследования биоразнообразия
Лектор - Щербаков Дмитрий Юрьевич, д.б.н., зав. лабораторией геносистематики ЛИН СО РАН, г. Иркутск
В курс входит введение в генетику популяций и сообществ, основные понятия и определения, используемые для описания генетического разнообразия, виды маркеров генетического разнообразия и их сравнительная характеристика. Обучающиеся узнают о генетике популяций нескольких видов - членов одного сообщества, связи генетического разнообразия и биоразнообразия, проведут оценку основных параметров популяций на основании анализа наборов нуклеотидных последовательностей (COI) и результатов исследования полиморфизма микросателлитных маркеров, а также анализ метагенома (Mothur), определение видового богатства, комбинирование информации метагеномного анализа и данных из генбанка, анализ состояния экосистемы с помощью исследования генетического разнообразия.

16 лекций и 16 семинаров
Биоинформатический анализ метагеномных данных
Лектор - Антонец Денис Викторович, ведущий программист лаборатории моделирования сложных систем Института систем информатики СО РАН
Основной целью курса является ознакомление студентов с современными методами метагеномного анализа, базирующегося на картировании и сборке геномных или транскриптомных прочтений материала микроорганизмов, полученных из среды.
В задачи курса входят обзор предметной области и основных направлений исследований, обзор экспериментальных методов, подходов к выделению материалов для исследования и пробоподготовки, обзор современных платформ высокопроизводительного секвенирования и их особенностей, обзор современных методов метагеномного анализа, методов оценки таксономического состава и разнообразия сообществ, их ограничений и особенностей интерпретации результатов.

15 лекций и 15 семинаров
Моделирование молекулярно-генетических систем
Лектор - Лашин Сергей Александрович, к.б.н., заведующий сектором биоинформатики и информационных технологий в генетике Лаборатории молекулярно-генетических систем ИЦиГ СО РАН, доцент кафедры информационной биологии ФЕН НГУ
В курсе рассматриваются основы математического моделирования молекулярно-генетических систем и процессов. На моделях биохимических реакций, генетической регуляции, метаболических путей, путей передачи сигналов обучающимся будут показаны особенности применения различных математических методов в задачах системной биологии, а также принципы построения метаболических моделей в масштабе генома.

14 лекций и 14 семинаров
Эволюция сложных систем
Лектор - Титов Игорь Иванович, к.ф.-м.н., с.н.с. сектора компьютерного анализа и моделирования биологических систем ИЦиГ СО РАН
Содержание курса охватывает круг вопросов, связанных со строением и свойствами биологических многочастичных систем, таких, как генные и метаболические сети, экологические популяции, их эволюцией и основными методами их анализа. Обучающимся приводятся данные о структурно-динамических свойствах биологических многочастичных систем, что в совокупности со сведениями о взаимодействиях элементов системы дает возможность студентам составить представление о сложных системах, их функционировании в живом мире, общих принципах их структурно-функциональной организации и эволюции.

22 лекции и 8 семинаров
Системная биология в биомедицине
Лектор - Колодкин Алексей Николаевич, Executive Director of the Netherlands' arm of ISBE-Light (the Infrastructure for Systems Biology Europe); Visiting Researcher, VU University Amsterdam; Research (and development) specialist The University of Luxembourg Centre for Systems Biomedicine (LCSB)
В курсе дается обзор методов системной биологии, применяемых в задачах биомедицины. Обучающиеся познакомятся с математическими и компьютерными моделями заболеваний человека, в том числе «цифровыми репликами» человека для P4 медицины: персонализированной, предсказательной, превентивной и пациент-ориентированной (personalised, predictive, preventive, participatory).

14 лекций и 14 семинаров
Анализ и моделирование сложных биологических систем
Лектор - Лашин Сергей Александрович, к.б.н., заведующий сектором биоинформатики и информационных технологий в генетике Лаборатории молекулярно-генетических систем ИЦиГ СО РАН, доцент кафедры информационной биологии ФЕН НГУ
Курс позволяет обучающимся узнать методы и подходы, применимые для решения задач генетики, экологии, эволюционной биологии, клеточной биологии. В настоящее время моделирование является популярным методом исследования в биологии поскольку позволяет объединять разные уровни организации биологических систем, начиная с молекулярно-клеточного и заканчивая популяционным и экосистемным уровнями. Обучающиеся получат навыки построения моделей на различных уровнях биологической организации.

18 лекций и 18 семинаров
Набор
1
Подать документы
Образовательный модуль реализуется в рамках программы направления «Прикладная математика и информатика» ММФ НГУ. Это направление находится внутри укрупненного направления «Математика и механика», и подавать документы нужно именно на него.
2
Пройти собеседование
Дистанционные собеседования с командой программы проходят в июле и августе. Участвовать необходимо только в одном из них — на выбор. Подробнее о процедуре отбора — на сайте.
3
Поступить
Контакты
Трубачева Анна Евгеньевна
координатор программы
trubacheva@bionet.nsc.ru
Афонников Дмитрий Аркадьевич
куратор профиля
ada@bionet.nsc.ru
Лашин Сергей Александрович
преподаватель программы
lashin@bionet.nsc.ru
Емельянов Павел Геннадьевич
заместитель декана ММФ
по магистратуре
emelyanov@mmf.nsu.ru