На Какие Вопросы Можно Ответить, Проанализировав 1 500 000 Уникальных Медицинских Записей?

Есть ли связь между астмой и шизофренией? Диабет и биполярное расстройство личности – может ли у них быть что-то общее? Сможет ли анализ базы данных 1 500 000 пациентов США выявить столь нетривиальные связи?

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

предупреждение: под катом много текста Статья написана по материалам доклада «Аутизм и менделевские болезни» Андрея Юрьевича Ржецкого на Первой международной конференции «Аутизм.

Проблемы и решения».

Подробнее об этом и об анализе данных Андрей Юрьевич Ржецкий

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

Андрей Ржецкий — профессор медицины и генетики человека Института геномики и системной биологии Чикагского университета.

Он также является директором Центра геномной биоинформатики при нейропсихических заболеваниях CONTE. А.

Ржецкий окончил Новосибирский государственный университет и защитил кандидатскую диссертацию в Институте цитологии и генетики в Новосибирске.

В 1991 году он уехал в США в качестве постдока.

Научные интересы: 1) биоинформатика и филогенетика применительно к анализу генов, белков, молекулярных метаболических путей; 2) применение статистики для анализа последовательностей и анализа молекулярных сетей; 3) разработка алгоритмов и программ анализа и сравнения метаболических путей и последовательностей, филогенетической реконструкции.

Как математик и биолог-теоретик Андрей Ржецкий является ведущим специалистом в области разработки новых биоинформатических подходов к анализу биологических комплексов и заболеваний.

Ученый является пионером в разработке стратегий биоинформационного картирования заболеваний посредством комплексного анализа генетических данных.

Андрей Юрьевич настолько известен в США, что в Google даже есть несколько подсказок по поиску по его фамилии:

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

Аутизм Аутизм — это расстройство нервного развития, характеризующееся трудностями в социальном взаимодействии и общении, а также ограниченным и повторяющимся поведением.

Согласно диагностическим критериям, симптомы аутизма должны проявляться у детей в возрасте до трех лет. Аутизм влияет на обработку информации в мозге, изменяя порядок организации и соединения синапсов нервных клеток.

Как это происходит, пока не совсем ясно.

Примерный перевод из Анго-Вики Менделевские болезни Менделевские болезни, признаки: заболевания или признаки, возникающие в результате экспрессии одного гена, оказывающего существенное влияние на фенотип.

Наследуется по законам Менделя.

Примеры менделевских заболеваний: муковисцидоз, серповидно-клеточная анемия, болезнь Хантингтона и гемофилия.

из Интернета



Абстрактный

Биология накопила огромные объемы данных, которые можно обработать только с помощью компьютера.

Группа Андрея Ржецкого взялась за обработку данных о нервно-психических расстройствах.

Вместо того, чтобы рассматривать единый набор данных, будь то генетика, факторы окружающей среды или клинические результаты, они рассматривают все данные вместе, чтобы получить более полную картину того, что вызывает расстройства.

В 2004 году группа А.

Ржецкого получила грант организации Autism Speaks на двусторонний анализ аутизма (как биологического процесса и как нарушения развития), используя богатство информации, накопленной в нескольких смежных областях.

Группа собрала информацию о молекулярных взаимодействиях в нейронах человека и с помощью своей уникальной программы (системы GeneWays) рассмотрела широкий спектр нарушений, с которыми аутизм проявляет неслучайные ассоциации (неврологические, аутоиммунные, метаболические и многие другие группы нарушений, которые имеют сильный наследственный компонент).

В 2007 году группа уже проанализировала 1,5 миллиона медицинских записей.

Суть работы заключается в изучении области пересечения на уровне отдельных генов различных заболеваний.

Исследователи пришли к выводу, что определенные группы генов могут предрасполагать человека к нескольким заболеваниям, тогда как другие могут предрасполагать человека только к одному заболеванию, одновременно защищая от другого.

Одна и та же мутация в гене может как коррелировать с другим заболеванием, так и защищать от него, делая невозможным сочетание двух разных заболеваний.

Модели, оценивающие данные из области аутизма, выявили возможность предрасположенности к биполярному расстройству.

В то же время при сравнении мигрени с аутизмом была обнаружена общая группа генов, а также связь между инфекциями и многими нервно-психическими расстройствами, включая аутизм.

Группа А.

Ржецкого была первой, кто измерил эти корреляции.

На графике (ниже) показана корреляция некоторых распространенных заболеваний.

Красные линии — положительная корреляция, синие линии — отрицательная.

Толщина линии — это величина корреляции.

Размер кружка соответствует выборке пациентов (от 20 до 136 тысяч).



Аутизм и менделевские болезни

Свою презентацию доктор Ржецкий открыл слайдом с известным кадром из российского фильма о Шерлоке Холмсе.

И это неслучайно: именно феномен Холмса, преуспевшего в сыскной работе благодаря вниманию к мелочам, незначительным для большинства рядовых наблюдателей, вдохновляет Ржецкого, который также уверен, что именно мелочи могут определить многое.

биологические загадки и помогите подобрать к ним ключи.

Он использует следующую метафору: болезнь — это преступление, данные — это доказательства.

Цель исследования: построение модели, дающей результат (нахождение «виновника» – причины заболевания) Символических изображений два: Ежик и Лисица.

Лиса знает много маленьких хитростей, еж знает только одну надежную хитрость.

В книге " Сигнал и шум Нейт Сильвер анализирует массу научных предсказаний.

А если посмотреть, какие прогнозы работают, а какие нет, то «Лисы» предсказывают лучше, чем «Ежики».

Проблема работы со статистическими данными состоит в том, что существует два подхода, сравнимых с религиозными.

Байесовский подход позволяет нам объяснить, насколько мы можем верить результатам и давать количественные прогнозы.

Проблема с построением надежной модели заключается в том, что вам нужно добавить данные фенотипа + генома + окружающей среды, чтобы получить модель с полезными прогнозами.

Например, тот, который может проанализировать предрасположенность ребенка к определенному заболеванию.

Итак, мы решили проанализировать множество заболеваний.

Почему? Потому что классификация болезней во многом искусственна.

На самом деле аутизм — это, наверное, «контейнер болезней» — с разными причинами, генетикой.

Небольшое отступление: Черчилль, Мартин Лютер Кинг, генерал Шерман, Рузвельт, Кеннеди, Ганди Что у них общего (кроме известности и смерти)? ответ здесь Общим у них было то, что у них было биполярно-депрессивное расстройство личности (маниакально-депрессивный психоз).

Черчилль называл свое состояние апатии «черной собакой депрессии».

Аффективные расстройства свойственны многим успешным политикам.

Каков фенотип аутиста: интересно, что Аспергер также сформулировал в группе «неспособность развивать социальные навыки», «поглощение мелкими деталями», кроме того, он обратил внимание на «неловкие движения».

Детей-аутистов он называл «маленькими профессорами» — все это мы до сих пор выделяем как критерии аутизма.

Немного аутизма необходимо для успеха в науке.

Мы не знаем точно, у кого из учёных в прошлом был аутизм (подозреваются Ньютон и Тесла), но у многих учёных была шизофрения и биполярное расстройство личности.

В книге «Невидимая чума» говорится, что за 260 лет возросла заболеваемость неврологическими и психическими заболеваниями (обработано много прямых и косвенных данных).

Вопрос о том, наблюдаем ли мы рост заболеваемости аутизмом, стоит очень остро: считают некоторые.

что есть прирост, другие - что нет. Центр по контролю заболеваний США приводит следующую статистику по аутизму: 1:80 для мальчиков, 1:240 для девочек.

Корейское исследование: попытка фенотипировать всю популяцию.

Они «прочесали» почти всех детей в Южной Корее и установили, что случаев аутизма становится намного больше и частота заболевания увеличивается.

По их данным, аутизмом страдают 4% мальчиков и 1,5% девочек.

Почему могут быть такие разные точки зрения, когда мы говорим о статистике и анализе? Причины:

  1. изменение диагностических критериев;
  2. есть экономические причины: например, они могут получить диагноз из-за финансовой заинтересованности;
  3. Врачи могут поставить диагноз по-разному.

Тем не менее, по словам Андрея Ржецкого, частота таких заболеваний, как аутизм, продолжает расти.

Что нужно, чтобы построить правдоподобную модель аутизма? Мы смоделировали окружающую среду и геном как случайные переменные.

Например, есть инфекция или нет – случайная величина, а изменения в геноме – тоже случайная генетическая переменная.

Возьми Р 1 и П 2 как два фенотипа (например, аутизм и диабет или аутизм и шизофрения), и у них обязательно будут «общие факторы».

И мы можем построить множество моделей, где P 1 пересекает/не пересекает P 2 в факторах окружающей среды, или в геноме, или в фенотипе.

Проблема в том, что все существующие модели взаимоотношений генотип-фенотип сейчас очень просты и не подходят для описания такого сложного заболевания, как аутизм.

И моделей, которые бы включали еще и окружение, практически нет. Помимо того, что мы не знаем КАК моделировать, мы не знаем, ЧТО должно быть включено в модель: Дональд Рамсфелд (министр обороны США) сказал: «Мы знаем кое-что, что мы знаем.

Есть вещи, которые мы знаем, но которых не знаем.

Но есть и кое-что, о чем мы не знаем, чего мы не знаем».

Также мы выделяем три типа факторов: «Известные известные» — хорошо изученные и всегда учитываемые факторы, «Известные неизвестные» — недостаточно изученные факторы, но попадают под подозрение, как способные повлиять на результат, и «Неизвестные неизвестные» – это факторы, влияющие на процесс, который мы изучаем, но о которых мы не знаем и даже не подозреваем о них и их существовании.

Пример связи генотип-фенотип-среда: Генотип: рецессивная мутация в Х-хромосоме.

Фенотип: дефицит белка фактора свертывания крови VIII (гемофилия А).

Среда: Для лечения берут кровь сотен тысяч людей.

Результат: более 80% больных гемофилией в США больны СПИДом и гепатитом.

(поскольку доноров когда-то не проверяли на эти заболевания) Когда факторы окружающей среды очевидны: Ожирение в США : количество людей с избыточным весом растет слишком быстро, чтобы это можно было объяснить геномным фактором, ведь прирост произошел за одно-два поколения:

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

Как окружающая среда влияет на аутизм? Данных пока недостаточно.

Чтобы добавить в модель «известные неизвестные», было опрошено множество родителей.

Это не причины аутизма, это факторы, которые следует учитывать.

Например: Мама жила на краю кукурузного поля, поле обрабатывали пестицидами и это могло дать эффект. Или другой фактор: инфекционное заболевание, высокая температура и затем регресс (потеря у ребенка речи и координации движений).

При моделировании необходимо учитывать все факторы; их нельзя игнорировать.

Вакцинация — это поле битвы за то, вызван ли аутизм или нет. Мы проверили гипотезу о том, что только вакцинация вызывает аутизм.

Эта гипотеза была отвергнута (хотя по поводу этого исследования возникает много вопросов).

Но остается неисследованной комбинация факторов: геном + вакцинация, и такая теория может быть верной.

Вместе с Джеймсом А.

Эвансом они изучали факторы, которые следует включить в генетическую модель аутизма.

Были опрошены ряд учёных, занимающихся проблемами аутизма.

Мы ожидали найти множество позиций согласия и островов разногласий, но обнаружили океан разногласий с маленькими островками единства.

Поэтому в модель были включены максимально возможные факторы.

Как на самом деле проводится генетическое тестирование? Задача проста, когда нужно сравнить одну хромосому – тогда легко найти совпадающий искаженный участок, что и приводит к заболеванию.

Но когда таких участков больше одного, когда хромосом несколько, задача значительно усложняется.

У человека около 20 000 генов.

Если мы просто ищем изменения, связанные с аутизмом, для любой комбинации генов, то число возможных комбинаций для 2 генов - 10^8 для 3 генов - 10^12 для 10 генов - 10^37 - т.е.

мирового населения недостаточно для сбора данных для анализа.

Как видите, то, что сработало для одного гена, не работает для многих.

Решение состоит в том, чтобы составить карту функциональных взаимоотношений генов и белков.

Где взять такую карту? Лаборатория Андрея Юрьевича проанализировала десятки тысяч статей в научных журналах, чтобы определить эти связи.

Вот такая получилась карта подключения

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

+ немного старая статья GeneWays: система для извлечения, анализа, визуализации и интеграции данных о молекулярных путях (2004 г.

) К счастью, искомые нами гены должны располагаться близко в функциональном пространстве — это хорошо проанализированная и надежная закономерность.

Итак, мы не проходим все варианты подряд, а только те, которые имеют наибольшую корреляцию между геномом и фенотипом.

Почему для анализа были взяты менделевские болезни? Они хорошо изучены, и известно, что за них отвечают определенные места генома.

Цветовое кодирование менделевских заболеваний при дальнейшей визуализации

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

Когда мы провели анализ нескольких заболеваний, оказалось, что одни и те же области молекулярной сети перекрываются при нескольких заболеваниях.

Пример скрытого подключения:



На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?



На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

Джоди Фостер и Рональд Рейган – что у них общего? Дон Хинкли пытается произвести впечатление на Джоди Фостер пытался убить Рональда Рейгана Фенотипы можно сравнить с известными личностями, генотипы – это скрытые связи между ними.

Если мы наблюдаем последовательность фенотипов: можем ли мы сделать выводы о генетике? Да, для условий моделирования это можно сделать.



Данные:

1 500 000 уникальных карт пациентов с кодировкой заболеваний по МКБ-9 на всю жизнь пациента.

Поскольку эти данные используются для определения страховых выплат в США, они не идеальны.

Но, учитывая их огромный объем, было бы преступлением их не проанализировать.

Используя пороговую модель для описания того, как генетические заболевания становятся фенотипами, можно оценить генетические ассоциации со сложными фенотипами заболеваний (такими как аутизм).

Красные края — самые прочные связи.

Прогноз: аутизм имеет общую генетику с множеством несвязанных заболеваний.

В результате анализа очевидна существенная связь аутизма с инфекционными заболеваниями и многими заболеваниями нервной системы.

Корреляция менделевских заболеваний с аутизмом, биполярным расстройством и шизофренией

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

Наконец, на графике ниже показана корреляция некоторых распространенных заболеваний в базе данных из 1 500 000 пациентов.

Красные линии — положительная корреляция, синие линии — отрицательная.

Толщина линии — это величина корреляции.

Размер кружка соответствует выборке пациентов (от 20 до 136 тысяч).



На какие вопросы можно ответить, проанализировав 1 500 000 уникальных медицинских записей?

Во время лекции профессор показал таблицу корреляций между сложными заболеваниями и менделевскими болезнями из неопубликованной работы, где было проанализировано 10 000 000 (да-да, 10 миллионов) уникальных карт заболеваний:

выводы

Доказано перекрытие участков генома при разных заболеваниях Каждое сложное заболевание имеет генетически связанный набор менделевских заболеваний.

Анализируя данные и объединяя их, мы приближаемся к построению модели проявления аутизма.

Надеюсь, вы все не уснули :)

ВНИМАНИЕ

Если у вас есть интересные разработки в области поиска связей, вы занимаетесь сравнением наборов данных, если вы занимаетесь генетическими исследованиями, то лаборатория Андрея Юрьевича Ржецкого заинтересована в широком и взаимовыгодном сотрудничестве.

Свяжитесь с ними! (ссылки внизу темы) Спасибо: Благодарю компанию «АйТек», в которой я работаю, моих менеджеров Юрия Балицкого и Романа Калашникова за предоставление «отгула» на три рабочих дня в пик сезона для нашей службы технической поддержки.

Спасибо профессиональному сообществу практикующих врачей «Профилактическая медицина» за первую международную конференцию по аутизму, в ходе которой мы смогли услышать замечательный доклад А.

Ю.

Ржецкий.

Выражаю искреннюю и глубокую благодарность фонду «Дитина с Майбутным» и лично Инне Сергиенко и Ларисе Рыбченко, а также руководителю Благотворительного фонда «Ассоциация родителей детей с аутизмом» Евгении Паничевской.

Благодарим вас за доверие и возможность собраться всем вам на 1-й Московской международной конференции «Аутизм: вызовы и решения».

Выражаю благодарность директору Фонда «Выход» Евгении Мишиной, оказавшей неоценимую материальную и моральную помощь в Москве, и вам, моим замечательным Светлане Моисеевой и Алие Янушевич, благодаря которым я не остался ночевать на вокзале.

И конечно всем, кто это организовал и волонтёрам: Екатерине Мень, Яне Золотовицкой из Центра проблем аутизма и всем остальным.



Избранные публикации А.

Ржецкого:

  • Иосифов И.

    , Чжэн Т.

    , Барон М.

    , Гиллиам Т.

    С.

    , Ржецкий А.

    (2008)Картирование генетических связей сложных наследственных заболеваний с полногеномной сетью молекулярного взаимодействия.

    Геном Рез.

    3 июня.

  • Фельдман И.

    , Ржецкий А.

    , Виткуп Д.

    (2008)Сетевые свойства генов, несущих наследственные мутации болезней.

    Proc Natl Acad Sci USA. 105, 4323-4328.

  • Родригес-Эстебан Р.

    , Ржецкий А.

    (2008) Шесть чувств в литературе.

    Мрачный сенсорный ландшафт биомедицинских текстов.

    EMBO, отчет 9, 212–215.

  • Яо Л.

    и Ржецкий А.

    (2008) Количественные детерминанты системного уровня генов человека, на которые нацелены успешные лекарства.

    Геном Рез.

    18:206-213.

  • Ржецкий А.

    , Вайнгурт Д.

    , Парк Н.

    и Чжэн Т.

    (2007) Исследование генетического совпадения сложных фенотипов человека.

    Учеб.

    Натл.

    акад. наук.

    США.

    104, 11694-11699.

  • Кокол М.

    , Родригес-Эстебан Р.

    и Ржецкий А.

    (2007) Рецепт сильного воздействия.

    Геном Биол, 8, 406.

  • Кокол М.

    , Иосифов И.

    , Родригес-Эстебан Р.

    и Ржецкий А.

    (2007) Сколько научных статей следует отозвать? Представитель EMBO, 8. 422-423.



Ссылки:

Одна из книг Ржецкого А.

Ю.

совместно с Жарких А.

А.

во времена СССР: «Новый подход к реконструкции филогений, основанный на анализе многих семейств генов»: book.google.com.ua/books/about/%D0%9D%D0%BE%D0%B2%D1%8B%D0%B9_%D0%BF%D0%BE%D0%B4%D1%85%D0 %BE%D0%B4_%D0%BA_%D1%80%D0%B5%D0%BA%D0%BE%D0%BD%D1%81.htmlЭid=RTPGHAAAAAJ&redir_esc=y Сайт Андрея Юрьевича: www.ci.uchicago.edu/research/rzhetsky Андрей Ржецкий в каталоге «Биомедэкспертс» www.biomedexperts.com/Profile.bme/1652205/Андрей_Ржецкий Статьи по результатам исследований: Сетевые свойства генов, несущих наследственные мутации заболеваний www.pnas.org/content/105/11/4323.full Исследование генетического совпадения сложных фенотипов человека www.pnas.org/content/104/28/11694.full Теги: #аутизм #массивы данных #алгоритмы поиска #алгоритмы сортировки #биоинформатика #Поисковые технологии

Вместе с данным постом часто просматривают:

Автор Статьи


Зарегистрирован: 2019-12-10 15:07:06
Баллов опыта: 0
Всего постов на сайте: 0
Всего комментарий на сайте: 0
Dima Manisha

Dima Manisha

Эксперт Wmlog. Профессиональный веб-мастер, SEO-специалист, дизайнер, маркетолог и интернет-предприниматель.