Привет всем, меня зовут Александр Соколов, и я хочу рассказать вам, как я сделал в домашних условиях секвенатор — устройство для декодирования ДНК.
Рыночная цена такого устройства составляет около 10 миллионов рублей.
Краткий экскурс в генетику.
Если вы вдруг помните, в 2003 году прозвучало сенсационное заявление: ученые наконец-то расшифровали геном человека.
Геном построен из ДНК, а ДНК — это исходный код организма.
ДНК представляет собой двойную цепь, состоящую из 4 типов нуклеотидов, которые повторяются в геноме человека около 3 миллиардов раз.
Подобно тому, как вся информация на вашем компьютере зашифрована в битах, нуклеотиды содержат инструкции по сборке всех белков в организме человека.
То есть, зная, в какой последовательности расположены нуклеотиды в ДНК, мы теоретически можем собрать все необходимые белки и получить модель человека.
Итак, в стандартном понимании ученые не расшифровали ДНК, а просто перевели химическую последовательность в набор нулей и единиц на компьютере.
Что с этим делать дальше – отдельный разговор.
Например, на данный момент мы понимаем функцию только 5% всего генома (это кодирование белков).
Можно только догадываться, чем занимаются оставшиеся 95%.
В 2003 году стоимость секвенирования ДНК человека составила около 100 миллионов долларов.
Со временем эта цифра снизилась и сейчас приближается к тысяче долларов.
Вы платите, вашу ДНК секвенируют и вам дают жёсткий диск с 3 ГБ информации — ваш геном в цифровой форме.
Сегодня на рынке существует три основных секвенсора.
Hiseq и его преемник NovaSeq с самой высокой пропускной способностью обеспечивают наименее затратное (флуоресцентное) секвенирование.
Один запуск длится несколько дней, и за это время обрабатываются геномы сразу нескольких людей.
Однако сам запуск стоит около десятков тысяч долларов.
Кстати, само устройство стоит около $1 млн, а так как оно устареет примерно за 3 года, то для того, чтобы оно окупилось, оно должно приносить вам $1000 в день.
Второе устройство появилось на рынке только прошлым летом.
Он называется Nanopore и основан на очень интересной технологии, при которой ДНК секвенируется путем пропускания ее через нанопоры.
Самый дешевый вариант, Nanopore, продается как одноразовый домашний секвенатор и стоит 1000 долларов.
Третье устройство — полупроводниковый секвенатор PGM, который стоит 50 тысяч долларов на родине и около 10 миллионов рублей (с доставкой, растаможкой и т. д.) в России.
Процесс секвенирования на нем занимает около нескольких часов.
Ну, у меня не было десяти миллионов, но я хотел PGM. Мне пришлось сделать это самому.
Во-первых, краткое введение в то, как работает полупроводниковое секвенирование.
Вся цепь ДНК делится на фрагменты длиной 300-400 нуклеотидов, называемые ридами.
Затем риды прикрепляются к маленьким сферам и многократно копируются — в результате на каждой сфере «висит» целая куча одинаковых фрагментов ДНК.
Копирование необходимо для усиления сигнала от каждого конкретного чтения.
Совокупность различных сфер называется библиотекой ДНК.
Сердцем ПГМ является одноразовый чип — матрица, похожая на матрицу в фотоаппарате, только вместо пикселей, реагирующих на свет, стоят pH-транзисторы, реагирующие на изменения кислотно-щелочного баланса.
Полученную библиотеку ДНК загружают в чип, содержащий 10 миллионов лунок, с pH-транзистором на дне каждой лунки.
В лунку помещается только одна сфера и, следовательно, только один тип чтения (с одной конкретной нуклеотидной последовательностью).
Далее в чип подаются реагенты, чтобы ДНК начала копировать себя.
Причем копируется линейно, то есть нуклеотиды присоединяются к вновь созданной цепи в том порядке, в котором они появляются в родительской цепи.
Поэтому в чип подается один тип нуклеотида – и сразу фиксируется изменение pH в некоторых лунках (это означает, что в них произошло добавление данного нуклеотида).
Далее подается другой тип нуклеотида и фиксируется изменение pH в лунках и т. д. Таким образом, многократно подавая на чип все 4 типа нуклеотидов, мы можем получить информацию о последовательности нуклеотидов в каждом прочтении.
Затем с помощью математических методов прочитанные короткие отрывки собираются на компьютере в единую цепочку.
Чтобы собрать его более-менее уверенно, каждое чтение нужно прочитать примерно 100 раз.
Рисунок 1. Полупроводниковое секвенирование
Теперь разберемся, из чего состоит само устройство.
Там, как мы уже знаем, находится чип, а также система подачи реагентов и материнская плата.
Все секвенирование осуществляется на чипе — остальная часть устройства лишь передает ему определенные сигналы, подает реагенты, считывает с него аналоговые сигналы, оцифровывает их и отправляет полученный поток информации на компьютер, где данные накапливаются и обрабатываются.
.
Рис.
2. Устройство секвенсора Чип позиционируется как одноразовый и после использования выбрасывается.
Соответственно там, где работает PGM, такие чипы можно получить бесплатно в любом количестве.
Зачем их брать, спросите вы? Дело в том, что чипом я уже успел воспользоваться много раз.
На самом деле он вечный: достаточно его хорошо прополоскать и можно использовать снова и снова.
По точности он ничем не будет отличаться от нового.
Сама моя идея заключалась в том, чтобы сделать устройство на этом условно-бесплатном чипе.
Итак, передо мной стояла задача реверс-инжиниринга чипа.
Никакой документации на заветную микросхему, конечно, найти не удалось – производитель не собирался делиться секретами производства, а хотел по-тихому продать свои устройства за $50 000. Для начала я сделал самое очевидное и простое: прозвонил контакты тестером.
Стало понятно, где расположены цифровые и аналоговые входы и выходы, питание и т.д. Нам удалось почерпнуть некоторую информацию из патентов на чип.
Но всего этого, конечно, было недостаточно для создания полноценного продукта.
Я все еще возился с чипом, проверял свои различные догадки, экспериментировал с отправкой сигналов, но фундаментального прогресса не добился.
Пришлось поставить проект на паузу.
Рис.
3. Непрерывность чипа И тут вдруг наткнулся на статью известного блогера на Хабрахабре.
БарсМонстр о том, как он занимается реверс-инжинирингом микросхем! Я вдохновился, написал ему, написал другим энтузиастам, отправил заявку в Киев, где фотографировали фишки.
Из Киева ответили, что не знают, как полировать послойно, могут снять только верхний слой, а так как микросхема у меня многослойная, то не будет понятно, куда идут дорожки от контактов.
Потом я встретил американца, который тоже занимается реверс-инжинирингом микросхем, прислал ему свои микросхемы, но и тут дальше фотографирования верхнего слоя дело не пошло.
Потом наткнулся в Интернете на статью о тех, кто смог перевернуть чип Sony PlayStation и т.п.
(«Слава героям!» и все, если кто знает).
Я решил написать им с вопросами, нашел их ники — и сразу понял, что один из них мне знаком.
Недавно друг познакомил меня со своим другом, который «тоже занимается генетикой на любительском уровне», мы общались с этим другом по скайпу и на этом диалог закончился.
И теперь я понимаю, что мой новый друг — мегакрутой мастер реверс-инжиниринга микросхем.
Я сразу написал ему.
Однако оказалось, что он хотя и был готов помочь, но микроскопа у него не было.
Опять тупик.
А через несколько месяцев нужный микроскоп был найден в соседней лаборатории! Правда, встроенная в него камера была ужасной; Сфотографировал мобильником через окуляр и получил снимки такого качества:
Рис.
4. Чип под микроскопом Потом, в прошлый Новый год, у меня на работе (я специалист по квантовой криптографии) появился отличный микроскоп за 130 тысяч.
Мечты сбываются.
Наконец-то мне удалось сделать хорошее фото чипа сверху.
Рис.
5. Мой рабочий микроскоп А потом.
Потом мне еще пришлось самому освоить технику полировки.
Сложность полировки заключается в удалении слоев металла толщиной около 1 микрона – при ширине скола 1 сантиметр.
Для сравнения скажу, что это примерно то же самое, что допустить погрешность не более 10 см на 1 км.
Я очень старался.
Результаты моих трудов представлены на следующем фото:
Рис.
6. Реверс-инжиниринг под оптическим микроскопом Достаточно хорошо видны нижний слой кремния, верхний слой с транзисторами, первый, второй, третий и четвертый слои металла.
Чип состоит из повторяющихся зон (типа сдвиговых регистров), и по таким картинкам было очень удобно его анализировать: сразу становилось понятно, что происходит на разных слоях.
Я «перевернул» самые «напичканные» разделы с обилием логики, которые повторялись много раз.
Но самым сложным оказалось проследить следы, проходящие по всей микросхеме, понять, какой внешний контакт к чему относится.
С новогодних праздников и до конца февраля я, вооружившись новым чудесным микроскопом, корпел над этой задачей – до десяти вечера сидел на работе, «задворяясь», размышляя.
И тут случилось новое чудо: друг смог организовать бесплатное фотографирование чипа послойно на электронном микроскопе в МИРЭА.
«Фотосессия» крохи на 1 кв.
см составила 50 ГБ черно-белых фотографий.
Теперь все эти отдельные фотографии нужно было как-то объединить в одну цельную картину.
Практически в тот же день я написал на Python программу, которая генерировала HTML-файл — открыв его в браузере, я получил то, что мне было нужно.
(Кстати, лучше всего с этим справилась самая старая 10-я Опера, рекомендую!) Потом я написал еще одну программу на javascript, которая позволяет сравнивать слои, плавно переходить между ними, выравнивать их, выбирать масштаб и т.д. Наконец-то у меня в руках имелись все инструменты для решения основных задач.
Я проследил следы, проходящие через чип, и восстановил всю его структуру до последнего транзистора.
Еще одно фото среза чипа, сделанное под рентгеном (в МИРЭА):
Рис.
7. Фотография под электронным микроскопом.
Хорошо видны отверстия, куда попадают сферы с ридами.
Ниже расположены три слоя металла, а еще ниже — слой с транзисторами.
Следующим этапом борьбы за светлое будущее стало создание материнской платы для чипа.
Я его спроектировал и отправил заказ на производство.
Тем временем суд и дело использовали для работы с чипом плату Mars Rover 2 с FPGA. (ПЛИС — это, грубо говоря, массив из 10 000 универсальных логических элементов; запрограммировав ПЛИС, мы можем получить любую логическую схему, способную легко обрабатывать гигабитные потоки информации.
) Прошивку для ПЛИС я написал сам, а кроме того, я написал программное обеспечение для динамического управления системой, в котором задается вся конфигурация ПЛИС.
Потом снова был шестимесячный перерыв (поехал в командировку на Байкал, подготовил в лаборатории установку, которую продемонстрировал Путину).
Но в итоге звезды сошлись: появилось время, приехали готовые платы, и я собрал свою систему.
Рис.
8. Создание аппаратного обеспечения Я подал все необходимые сигналы и – о чудо! – Я увидел на осциллографе сигнал от чипа.
(Я когда-то купил на eBay осциллограф за 6000 рублей, прошивка к нему стоила еще 1000.) На снимке хорошо видны пятна - капельки какого-то реагента.
Рис.
9. Сигнал с микросхемы на осциллографе Теперь мне предстояло придумать, как эту картинку оцифровать и перенести на компьютер.
Я собрал такую установку:
Рис.
10. Схема устройства
Рис.
11. Готовая установка Имеется компьютер, который подает управляющие данные на плату ПЛИС.
Плата генерирует цифровые сигналы и отправляет их на чип.
Сигнал с микросхемы поступает на усилитель, затем на АЦП на плате, оцифровывается и через COM-порт передается на компьютер.
В целом пропускная способность COM-порта невелика: 15 килобит в секунду (поскольку один чип содержит от 1 до 10 миллионов «пикселей», а максимальная скорость передачи — 115200 бод).
Тем не менее картинка в итоге попадает на компьютер.
Рис.
12. Обработанный сигнал на компьютере.
На фото выше видно, что при нанесении библиотеки ДНК на использованный чип чип заполняется неравномерно: по краям – в меньшей степени.
Разные цвета обусловлены разным напряжением на pH-транзисторах.
То есть мы можем четко различить те лунки, куда попали сферы с чтениями — это в дальнейшем поможет нам контролировать промывку чипа.
Соответственно, следующей задачей была промывка чипа.
Нужно было добиться того, чтобы он стал как новый.
К счастью, в качестве эталона у меня был совершенно новый чип.
На илл.
И видно, что в активной области такой чип практически одинакового цвета (повторяющиеся вертикальные полосы - это просто шум, помехи).
Рис.
13. Промывка стружки На рис.
13 Б неудачно отмытая микросхема – она разноцветная.
На рис.
13D — использованная, но хорошо промытая щепа.
Видно, что градиент по краям исчез.
Однако доказать, что он действительно чистый и его можно использовать повторно, все равно стоило бы.
Поскольку библиотеки ДНК прикрепляются к танталовому покрытию чипа в кислой среде и открепляются в щелочной среде (то есть при высоком pH), чип промывают с помощью специальных полуавтоматических пипеток растворами с разными значениями pH. На сегодняшний день мне удалось добиться практически полной очистки чипа.
Меня спросили, почему, когда я полностью понял устройство чипа, я не заказал его изготовление, а предпочел продолжать искать и привыкать, возиться с их промывкой и т. д. Да потому, что разработка чипа стоит огромные деньги, миллионы долларов, и значительная часть этой суммы уходит на физическую отладку полученного изделия: настройку, настройку всех параметров транзистора и т. д. То есть простого копирования логической схемы недостаточно.
Поэтому я беру условно-бесплатную, готовую – спроектированную, изготовленную, отлаженную – микросхему и тем самым экономлю значительные средства, серьезно снижая стоимость проекта.
Следующей моей задачей было собрать более совершенное устройство, которое позволило бы быстрее передавать информацию на компьютер и не состояло бы из огромного количества отдельных плат.
Рис.
14 Разработка следующей версии устройства Взял новую плату с ПЛИС — на том же кристалле было 2 ядра ARM с Linux, был Gigabit Ethernet и прочие вкусности, но, в отличие от предыдущей версии, не было АЦП.
Позже я спроектировал еще одну плату, с быстродействующими АЦП и всеми другими необходимыми элементами.
Я запустил и все заработало.
Что осталось сделать, чтобы появилось финальное устройство? Всего три вещи.
Первый.
Вам нужен гигабитный интернет, быстрая передача данных на компьютер.
Я реализовал это буквально вчера.
Второй.
Система подачи реагентов.
Проектирование специального клапана уже ведется.
Третий.
Программное обеспечение для обработки информации с чипа.
С программным обеспечением еще остались вопросы, поэтому приглашаю программистов к сотрудничеству.
Итоговое устройство стоит 10 миллионов рублей.
Стоимость секвенирования составляет несколько тысяч долларов.
Чипы стоят от 100 до 1000 долларов в зависимости от количества «пикселей» в них.
(Кстати, восстановление чипов само по себе может быть неплохим доходом, особенно если учесть, что промывка требует всего пары кликов.
) Реагенты тоже покупаются, но в будущем они тоже будут создаваться.
В общем, все это очень интересно, но главное, что за этим будущее.
Сегодня биотехнология занимает такое же место в мировом научно-техническом прогрессе, какое занимали компьютерные технологии в 80-е годы.
прошлый век.
В то же время секвенирование является одним из ключевых направлений современной биологии и медицины.
И, конечно же, биотехнология очень прибыльна.
Недавно на рынке появился полупроводниковый секвенатор S5, и я планирую перейти на него в ближайшем будущем.
Буду рад общению со всеми, кто хочет так или иначе поучаствовать в развитии этого проекта! Проект был бы невозможен без теоретической подготовки.
Выражаю ему свою благодарность.
Спасибо за внимание! Теги: #Сделай сам или Сделай сам #сделай сам #Биотехнология #ДНК #генетика #Секвенатор
-
Муавр, Абрахам
19 Oct, 24 -
Виртуальная Земля: Теперь В 3D
19 Oct, 24 -
.Net: Хорошие Стороны — От Clr К Сообществу
19 Oct, 24 -
Extreme Agile – Танцую Один
19 Oct, 24 -
Углубление Озера 100 Раз
19 Oct, 24 -
Требования К Функционалу Игры
19 Oct, 24