Биоинформатика – перспективная область науки и быстро развивающаяся отрасль.
Использование информационных технологий в биологических исследованиях сегодня позволяет тестировать лекарства в виртуальной среде и расшифровывать последовательности ДНК за считанные часы.
В этом материале мы поговорим о биоинформатике и о том, какие разработки в этой области ведутся в России.
Что такое биоинформатика
Многие ученые сходятся во мнении, что биоинформатика предназначена для изучения биологических процессов с использованием современных вычислительных технологий.Фактически специалисты в этой области используют программы для визуализации аминокислотных последовательностей, а также разрабатывают алгоритмы, основанные на теории вероятностей и математической статистике.
Однако первоначальная цель биоинформатики была более общей: Полин Хогевег и Бен Хеспер в 1970 году.
определенный это как «изучение информационных процессов в биотических системах».
Если ориентироваться на это определение, то зарождение науки можно отнести к 13 веку, когда Фибоначчи построил первую математическую модель процесса размножения кроликов.
С тех пор ученые начали использовать более формальные методы для описания биологических процессов.
В 1953 году произошло одно из важнейших событий в истории биоинформатики, а может быть, и науки в целом: Фрэнсис Крик и Джеймс Уотсон.
идентифицированный структура ДНК, которая сегодня известна каждому еще со школы.
Спустя два десятилетия были разработаны методы секвенирования ДНК — расшифровки ее последовательности, а затем был получен первый полный геном живого организма — бактериофаг fX174. Достижения в области технологий секвенирования ускорили этот процесс, что привело к сбору последовательностей генома дрожжей и мух-дрозофил.
Поворотным моментом в истории биоинформатики стал сборка в 2003 году — геном человека: ученые со всего мира потратили 13 лет на то, чтобы собрать воедино его последовательность.
С этого момента начинается так называемая постгеномная эра в развитии биоинформатики.
Его главная особенность — огромный объем биологических данных, которые невозможно обработать вручную.
Именно здесь в игру вступают цифровые технологии, позволяющие не только интерпретировать молекулярные данные, будь то последовательности нуклеиновых кислот и аминокислот или структура белков, но и организовывать их в базы данных.
Например, в банке данных GenBank хранится более 11 миллиардов генов от более чем ста тысяч организмов.
Кстати, сами исследователи не очень любят термин «расшифровка» генома: они предпочитают использовать слово «сборка» или «определение последовательности генома» — это позволяет указать, что даже в тех областях, где Находясь на протяжении многих лет под пристальным наблюдением ученых, нерешенные вопросы остаются задачами.
Например, в геноме человека до сих пор есть неизвестные фрагменты.
Более того, даже знание всей последовательности генома не указывает на его функцию.
Именно поэтому многие ученые, занимающиеся биоинформатикой, сейчас изучают связи между уже известными генами и их влиянием на фенотип: по сути, исследователям приходится решать уже известные проблемы, но быстрее и лучше, используя новые методы и технологии.
Биоинформатика тесно переплетена с другими науки , в частности, с геномикой и протеомикой.
Геномика изучает совокупность генов в организме.
Имея большие базы данных геномов, мы можем выявлять сходства и различия в генотипах живых существ, делая тем самым выводы об особенностях отдельных видов и об эволюции в целом – этим и занимается сравнительная геномика.
Функции генов, а также влияние одних генов на другие изучает функциональная геномика.
Благодаря методам структурной геномики создаются трехмерные модели белков, кодируемых определенным геном.
Протеомика изучает совокупность продуктов экспрессии генов — белков.
Особенно активно развивается область сравнительной протеомики, суть которой — сравнение белкового состава, или протеома, живых организмов.
Сравнение протеомов двух организмов позволяет выявить причины различий их фенотипов, что, в свою очередь, помогает понять ход эволюции.
Сравнительная протеомика также позволяет идентифицировать белки, отрицательно влияющие на развитие заболевания, и тестировать на них препараты.
С одной стороны, биоинформатика — это междисциплинарная область, содержащая знания из молекулярной биологии, генетики, математики и информатики.
С другой стороны, биоинформатика, используя открытия в этих науках, также вносит значительный вклад в их развитие: отчасти это отражено в названиях современных технологий – деревья решений, нейронные сети, генетические алгоритмы.
Разработки Университета ИТМО
В Университете ИТМО проводятся многочисленные исследования в области биоинформатики.В 2011 году был создан лаборатория структурная биоинформатика, где проводятся эксперименты по моделированию белков и прогнозированию белок-белковых взаимодействий.
Одной из последних разработок лаборатории является метод изучение динамики белков на основе принципа массопереноса.
Модель перемещений, осуществляемых на относительно большие расстояния, вполне адекватна и устраняет недостатки предыдущих моделей.
Один из руководителей НИИ биоинженерии Андрей Каява верит Не менее важной задачей является выявление функций белков.
Случайные перестройки в структуре белка могут привести к нейродегенеративным заболеваниям, таким как болезни Альцгеймера и Паркинсона.
Биоинформатика позволяет изучать аминокислотные последовательности и прогнозировать вероятное возникновение этих заболеваний.
Метод и программа ArchCandy, развитый Научная группа Андрея Каявы помогает решить проблему диагностики нейродегенеративных заболеваний на ранней стадии.
Сотрудники кафедры компьютерных технологий приняли активное участие в ряде научных проектов.
Началом их научного пути в области биоинформатики стало участие в международном конкурсе.
Проект оценки сборки генома de novo .
Участникам удалось развивать и протестировать метод сборки генома, исключающий ошибки при чтении — данных, которые получают с помощью специальных машин для секвенирования.
В другой работа Молодые исследователи из Университета ИТМО описывают метод сборки контигов — длинных перекрывающихся сегментов ДНК, — который предполагает разделение сборки на два этапа: первый использует граф де Брюэна, второй — граф перекрытия.
В более поздней работе также описан метод, где одним из этапов является микросборка: по показаниям строится график де Брюэна, размер которого оказывается значительно меньше графика с первого этапа – отсюда и название «микросборка».
Результатом работы учёных стала программа для сборки генома «ИТМО Ассемблер», которую можно скачать по адресу связь .
секвенаторы ДНК
Продолжением этой работы стало участие Сотрудники Университета ИТМО в проекте MetaFast. Суть проекта заключается в разработке программного комплекса, позволяющего сравнивать метагеномы — коллекции ДНК микроорганизмов — в различных средах.
ДНК организмов, которые не могут размножаться, таких как вирусы, трудно собрать, поскольку она дает лишь фрагментарные данные.
В базах ДНК слишком мало данных о вирусах и других бактериях, чтобы сравнивать с ними фрагменты полученных метагеномов, а углубленный анализ занимает слишком много времени.
Разработанная программа работает значительно быстрее, осуществляя лишь частичный сбор и сравнение геномов.
Кроме того, алгоритм может выявлять закономерности даже в незнакомой среде.
По словам Владимира Ульянцева, сотрудника лаборатории компьютерных технологий Университета ИТМО и главного разработчика алгоритма, такой подход помогает находить у пациентов микроорганизмы, ответственные за склонность к конкретному заболеванию.
Сравнивая микрофлору здоровых и больных людей, можно быстро выявить причину заболевания и принять меры по ее устранению.
MetaFast был протестирован в различных средах, в том числе с высоким уровнем вирусов.
Например, ученые доказали безопасность микробов, живущих под землей.
Они обнаружили, что образцы, взятые в метро Нью-Йорка, в основном содержали уже известные бактерии.
Новый алгоритм также может быть полезен при изучении процессов урбанизации.
Городская атмосфера негативно влияет на нашу микрофлору, а современные продукты уничтожают необходимые организму бактерии.
Сравнивая метагеномы жителей крупных городов и отдаленных населенных пунктов, можно узнать, что это за полезные бактерии и как их сохранить.
Сотрудники Университета ИТМО также приняли участие в международном мероприятии.
проект по разработке веб-сервиса для комплексного исследования функционирования клеток.
Программа GAM (гены и метаболиты), разработанная аспирантом Университета ИТМО Алексеем Сергушичевым, выявляет связи между генами и изменениями метаболизма.
Например, когда необходимо изучить процесс развития опухоли, программа берет исходные данные о концентрации метаболитов — простых веществ, участвующих в обмене веществ — и экспрессии генов и сравнивает их с данными в базе данных KEGG. После этого строится карта путей обмена веществ, показывающая процесс изменения веществ в результате химических реакций.
Услуга будет полезна при лечении заболеваний, связанных с нарушениями иммунной системы и онкологических заболеваний.
Карты метаболитных изменений помогают отслеживать развитие опухоли и разрабатывать механизмы ее сдерживания на ранних стадиях.
С помощью разработанного алгоритма ученые уже доказали, что если замедлить метаболический процесс при раке легких, скорость роста опухоли снизится.
В отличие от своих аналогов, веб-сервис GAM одновременно прост, эффективен и, что немаловажно, бесплатен, поэтому им может воспользоваться каждый.
Сервисом уже пользуются несколько десятков лабораторий и фармацевтических компаний.
Вывод: кратко для тех, кто интересуется биоинформатикой
Многих студентов и выпускников, в том числе программистов и математиков, интересует, как попасть в сферу биоинформатики.
Во-первых, вам нужно решить, какие проблемы вы заинтересованы в решении.
В биоинформатике спектр задач очень широк: от чистой информатики и доказательства теорем до чистой биологии, в которой новичкам приходится активно разбираться.
Очевидно, что большая часть исследований находится на стыке нескольких областей.
Затем вам нужно выяснить, какие места занимаются тем, что вас интересует. Для этого вам придется изучить конкретные статьи лаборатории и оцените, действительно ли вы хотите участвовать в их работе.
При этом не помешает записаться на курсы в Институт Биоинформатики или поищите онлайн-курсы, подобные тем, которые предлагает Курсера .
Таким образом, вы сможете получить представление о том, чем сейчас занимается биоинформатика и как она работает. При этом важно понимать: поскольку биоинформатика — дисциплина, находящаяся на стыке нескольких областей, проекты в этой области могут быть связаны не только с использованием возможностей информатики для решения биологических задач, но и наоборот. Ярким примером этого является компиляция учебная программа с использованием ДНК-компьютеров.
Не говоря уже о синтетической биологии, которая пытается создать или модифицировать микроорганизмы для определенной цели: например, для улучшения переработки биотоплива.
Эти проекты и биоинформатика в целом — яркий пример того, что современная наука может быть захватывающей и увлекательной — не только на большом киноэкране, но и в реальной жизни.
И для того, чтобы принять участие в таких разработках, вовсе не обязательно учиться или работать за границей: множество интересных и значимых проектов в области биоинформатики разрабатывается в российских университетах, в частности в Университете ИТМО.
Теги: #ИТМО #биоинформатика #геном #Анализ и проектирование систем #Алгоритмы #математика
-
Веб-Сайт Wordpress Для Малого Бизнеса
19 Oct, 24 -
Sk Hynix Представила Первую В Мире Dram Ddr5
19 Oct, 24 -
Глотание – Вовремя?
19 Oct, 24 -
Стоит Ли Развивать Кросс-Компетенции?
19 Oct, 24 -
Состояние Эмоционального Потока
19 Oct, 24 -
Пьяный Вася
19 Oct, 24