Разработка программного комплекса WebMCOT для поиска совместно встречаемых ДНК-мотивов сайтов связывания транскрипционных факторов

Мухин Алексей Максимович
1. Новосибирский государственный университет
2. Института цитологии и генетики СО РАН
mukhin@bionet.nsc.ru
Левицкий Виктор Георгиевич
1. Институт цитологии и генетики СО РАН
levitsky@bionet.nsc.ru
Лашин Сергей Александрович
1. Институт цитологии и генетики СО РАН
lashin@bionet.nsc.ru
Материал поступил в редколлегию 21.05.2019
Регуляция биологических процессов транскрипции генов осуществляется с помощью специфичных белков,
а именно транскрипционных факторов. Транскрипционные факторы связываются с определенными участками
геномной ДНК (сайтами связывания), которые называются мотивами. Совместное действие двух и более
транскрипционных факторов является очень широко распространенным механизмом их действия. Поэтому
термином «композиционный элемент» называют устойчивое сочетание двух близко расположенных и часто
встречаемых мотивов. Композиционные элементы можно классифицировать по наличию перекрывания двух
мотивов или их расположению со спейсером. В настоящее время развитие технологий массового секвениро-
вания (ChIP-seq) сделало доступными геномные профили сайтов связывания для многих «якорных» транс-
крипционных факторов, поэтому задача поиска комбинаций «якорного» и других («партнерских») мотивов
стала очень актуальной. Однако у существующих подходов к поиску пар таких мотивов есть ограничения: ли-
бо решение не способно предсказывать пересечение мотивов, либо оно может это делать, но тогда ему нужны
дополнительные данные экспериментов ChIP-seq по партнерским мотивам, получение которых является доро-
гостоящим. В Институте цитологии и генетики СО РАН была реализована программа MCOT, сочетающая по-
иск мотивов с учетом их пересечения и анализ одного набора данных ChIP-seq. Для данной программы отсут-
ствовал графический интерфейс для того, чтобы пользователи могли вводить файлы в удобной форме
и получать результаты в графическом и табличном виде. В данной работе представлен разработанный про-
граммный комплекс WebMCOT, предназначенный для поиска совместно встречаемых ДНК-мотивов на осно-
ве результатов эксперимента ChIP-seq. Программный комплекс состоит из трех частей с использованием раз-
личных языков программирования. В статье описываются список используемых программных инструментов
с аргументацией их выбора, архитектура программного комплекса и интерфейс веб-сайта.
Выходные данные: А.М. Мухин, В.Г. Левицкий, С.А. Лашин Разработка программного комплекса WebMCOT для поиска совместно встречаемых ДНК-мотивов сайтов связывания транскрипционных факторов. Вестник НГУ. Серия: Информационные технологии. 2019. Т. 17, №4. C. 74–86. DOI: 10.25205/1818-7900-2019-17-4-5-74-86