Секвенирование ДНК за последние десятилетия превратилось из нишевой области, в которой занимаются немногие ученые, в одну из наиболее быстро развивающихся технологий.
Рост производительности и падение себестоимости даже опережают закон Мура, и благодаря большой конкуренции на рынке и огромному спросу развитие продолжит идти высокими темпами.
Кроме того, развитие секвенирования привело к аналогичному буму в биоинформатике и фундаментально изменило биологию, а постепенно кардинально меняет и медицину.
В видео я подробнее рассказываю, как они это делают. Что такое ДНК
Для начала, чтобы понять сам процесс, необходима немного теории.
ДНК — это полимерная цепь, состоящая из четырех типов мономеров, называемых нуклеотидами, последовательность которых кодирует информацию об организме.
Другими словами, ДНК можно рассматривать как текст, написанный четырехбуквенным алфавитом.
ДНК — молекула, состоящая из двух цепей, и хотя последовательность нуклеотидов различна, последовательность одной цепи можно однозначно реконструировать, если известна последовательность другой.
Поэтому цепи называются комплементарными.
(англ.
Complement — дополнение) Это свойство используется при копировании клетки, когда цепи ДНК расплетаются, и на каждой, как на матрице, синтезируется вторая, и каждая из двух дочерних клеток получает свою двухцепочечную ДНК.
Вся последовательность ДНК организма называется геномом.
Например, геном человека состоит из 46 хромосом.
Несмотря на большое количество различных, как экспериментальных, так и устаревших методов, основные коммерческие методы достаточно схожи, и чтобы не делать каждый раз оговорок, сразу скажу, что дальнейшее будет именно об этих основных методах.
Как это выглядит в целом Прежде чем описывать технологию секвенирования, для интуитивного понимания проведу следующую аналогию: стопку одинаковых газет взрывают так, что они разлетаются на мелкие кусочки с фрагментами текста, а затем каждый из этих кусочков считывается и по этим прочтениям , текст оригинальной газеты восстановлен.
Для секвенирования ДНК ее сначала выделяют из исследуемого образца, затем случайным образом разрезают на небольшие фрагменты, эти фрагменты называются прочтениями.
От каждого прочтения остается одна цепочка, и на этой цепочке, как на матрице, синтезируется вторая и каким-то образом определяется тип каждого последующего добавленного нуклеотида.
Таким образом, записывая последовательность присоединенных нуклеотидов, восстанавливается их последовательность в каждом прочтении.
Затем геном реконструируется из прочитанных последовательностей с помощью компьютерных программ.
Важная точка.
Суммарная длина ридов должна во много раз превышать длину исследуемой ДНК.
Это делается потому, что при извлечении ДНК из образца и при его разрезании часть ее теряется, поэтому никто не может гарантировать, что каждый ее участок будет включен хотя бы в одно чтение.
Поэтому, чтобы каждый раздел был гарантированно прочитан, ДНК берется с большим запасом.
Кроме того, при секвенировании возможны ошибки, а для более достоверного считывания ДНК каждый ее участок необходимо читать несколько раз.
ДНК разрезается на прочтения, которые считываются, и по ним восстанавливается исходная последовательность.
Эта техника не используется для хорошей жизни.
Это добавляет немало сложностей, и если бы исследователи могли взять и прочитать сразу всю последовательность генома, они были бы счастливы, однако на данный момент это невозможно.
Для этого есть две причины.
Первый — это ошибки, возникающие при чтении каждого нуклеотида.
Они постепенно накапливаются, и каждый последующий нуклеотид читается хуже предыдущего, и в какой-то момент качество чтения падает настолько, что продолжать процесс становится бессмысленно.
Различные методы секвенирования имеют длину считывания, которую они могут хорошо считывать, порядка десятков или сотен нуклеотидов.
Во-вторых, ДНК — очень длинная молекула, и при скрупулезном чтении каждой буквы одну за другой секвенирование заняло бы неприлично много времени, но в этом случае этот процесс легко распараллеливается, и одновременно можно прочитать миллионы и миллиарды чтений.
.
Иллюмина
Эта схема в целом описывает все популярные методы секвенирования.
Они различаются лишь способами обнаружения добавленных нуклеотидов при синтезе и способом приготовления материала.
Сегодня наиболее распространенным методом является метод, используемый в секвенаторах Illumina. В этом методе к стеклянной пластине сначала прикрепляют множество различных считываний.
Затем с каждого прочтения на поверхности пластинки делается множество копий так, что на каждом небольшом участке остаются только идентичные копии.
Это делается для того, чтобы при последующем секвенировании получить сигнал не от одной молекулы, а от группы идентичных молекул, расположенных рядом.
Это облегчает считывание сигнала и повышает надежность считывания.
Эти молекулы представляют собой одноцепочечную ДНК, и в процессе секвенирования из них синтезируются комплементарные цепи.
Реакция синтеза проводится следующим образом: к началу каждой молекулы добавляется один нуклеотид. Этот нуклеотид химически блокируется, так что после его присоединения синтез дальше не идет. Кроме того, к нему прикреплена метка, которая люминесцирует под действием лазера.
При этом для каждого типа нуклеотидов цвет свечения разный.
После присоединения нуклеотида пластинку освещают лазером, и камера фиксирует цвета, которыми люминесцирует пластинка.
После этого блокировка снимается, метка также удаляется и таким же образом добавляется следующий нуклеотид. Последовательность световых сигналов на каждом участке пластинки преобразуется в последовательность нуклеотидов на компьютере, а на выходе получается файл, содержащий последовательности считываний.
Секвенирование Illumina
1 - геномная ДНК 2 - разрезана на риды 3 - к ридам прикрепляются адаптеры, с помощью которых они приклеиваются к планшету 4 - риды размножаются на планшете 6 - вставляются в секвенатор и 7 - секвенируются Сборка генома и аннотация
Если геномы подобных организмов ранее не секвенировались, то из прочтений затем с помощью программ пытаются собрать единую нуклеотидную последовательность.
Читания частично перекрываются, и с помощью этих перекрытий пытаются построить единую последовательность.
Здесь есть много моментов, которые существенно усложняют дело.
Например, вы можете загрязнить образец, и программа попытается построить одну последовательность из ДНК разных организмов.
Секвенатор может допустить ошибку при чтении или неправильно связать два места генома, поскольку они очень похожи.
На самом деле сложностей так много, что перечислить их все здесь невозможно.
Причем некоторые из них настолько трудно устранить, что даже геном человека, самый важный и широко изученный геном, до сих пор полностью не секвенирован.
читает и ниже последовательность генома, которая реконструируется на их основе
Как только последовательность генома будет собрана, нам нужно понять, что это значит. Они находят на нем участки, похожие на гены.
Делается это следующим образом: В начале и конце генов имеются определенные «метки» нуклеотидов, и если такие последовательности встречаются на ДНК на таком расстоянии, что между ними может поместиться ген, то такое место включается в список потенциальных генов.
Затем этого кандидата сравнивают с базой данных уже известных генов других организмов, и если в ней обнаруживается ген, достаточно похожий на этот участок, то ему присваивают функцию этого гена.
Если геном другого организма этого вида уже секвенирован, то его используют для сборки.
Поскольку геномы разных организмов одного вида различаются незначительно, для каждого прочтения находят то место в секвенированном геноме, к которому оно ближе всего, и на основе этого генома собирают новый.
Теги: #Биология #Популярная наука #Биотехнология #биоинформатика #секвенирование #illumina
-
Пять Рабочих Схем Монетизации Стартапов
19 Oct, 24 -
Mediatek Mt6595: Впечатления От... Чипсета
19 Oct, 24 -
Ms — Империя Зла, А Google — Добро?
19 Oct, 24