Полный анализ генома дома за $200: обзор сервисов Nebula, Just-DNA и других. Часть 1

Жажда познания — мощный двигатель прогресса. Однажды я задался целью расшифровать собственный геном, чтобы заглянуть в «код» своего организма, и столкнулся с необходимостью разобраться в нюансах: как сделать это за разумные деньги и, что не менее важно, как грамотно интерпретировать полученные массивы данных.

В этом материале я поделюсь опытом прохождения процедуры секвенирования и методами обработки данных с применением как коммерческого, так и свободного программного обеспечения.

Убежден, что специалисты в биоинформатике владеют этой темой куда глубже, поэтому буду искренне рад дополнениям и экспертным комментариям.

Полногеномное секвенирование (WGS) против генотипирования

Whole Genome Sequencing (WGS) принципиально отличается от популярных ДНК-тестов за 10 тысяч рублей. Последние выполняются на специализированных микрочипах, способных распознать лишь фиксированный набор мутаций — от 300 до 750 тысяч в зависимости от поколения чипа. Технически это напоминает трафарет: фрагменты ДНК прикрепляются к ячейкам, «заточенным» под поиск конкретных генетических вариаций. Безусловно, генотипирование — полезный и доступный инструмент для выявления типичных наследственных рисков, себестоимость которого не превышает $20–40.

Однако генотипирование ограничено «прошивкой» чипа, созданной инженерами компаний уровня Illumina или Thermo Fisher Scientific. Если у вас редкая, уникальная мутация, которой нет в базе данных чипа, тест её просто не «увидит». Полногеномное секвенирование (WGS), напротив, «прочитывает» весь массив данных целиком, позволяя биоинформатикам обнаружить любые, даже самые редкие аномалии.

Себестоимость WGS варьируется от $200 до $400, но на выходе вы получаете не только «сырые» файлы (форматы FASTQ, BAM, VCF), но и полную карту собственного генетического кода.

Dante Labs: тернистый путь к первому секвенированию

В ноябре 2018 года, поддавшись магии «Черной пятницы», я заказал услугу у итальянской лаборатории Dante по акции: $199 за полное секвенирование с покрытием 15x и анализом мтДНК. Я отправил биоматериал в пластиковом контейнере по указанному европейскому адресу.

Проходили месяцы, но результатов не было. Как выяснилось позже, бизнес-модель компании строилась на «догрузке» промышленных секвенаторов: они использовали остаточные мощности лабораторий по дешевке, что критически затягивало сроки. В итоге мою пробу либо потеряли, либо испортили, и потребовалась повторная отправка образца. В конечном счете я оформил возврат средств через PayPal, сделав для себя вывод, что разгильдяйство не имеет границ, а в Dante с ним сталкиваешься на каждом шагу.

Nebula: вторая попытка и успех

В ноябре 2021 года я решил рискнуть снова, выбрав Nebula за $180 (плюс небольшая подписка). Изучение профильных форумов подтвердило, что, несмотря на секвенирование в Китае, с этой компанией можно иметь дело — такова специфика рынка: фирмы стремятся максимально оптимизировать расходы на логистику биоматериала.

О выборе покрытия: x30 против x100

На выбор предлагались варианты с покрытием x30 и x100. Покрытие — это показатель того, сколько раз в среднем был «прочитан» каждый нуклеотид. Покрытие x100 обошлось бы в $600. Поскольку при секвенировании нить ДНК нарезается на фрагменты, которые затем собираются алгоритмами, «золотым стандартом» для клинических и персональных целей считается 30x. Этого достаточно для большинства задач: от фармакогенетики до генеалогии. Я остановился на x30.

Логистика

Поскольку прямая доставка в Россию отсутствовала, я воспользовался услугами форвардинговой компании в США. Чтобы минимизировать риски, в таможенных декларациях указывал «Plastic vial» стоимостью $7. Обратную переправку образца в США организовал через Почту России обычным отправлением — курьерские службы в этом случае создают лишь лишние административные сложности.

Стоит отметить важный нюанс: с 1 сентября 2026 года, согласно Федеральному закону № 43-ФЗ, порядок отправки биоматериалов за рубеж был существенно изменен и фактически запрещен (требуется тщательное изучение правоприменительной практики данных поправок).

Не обошлось без приключений: Nebula заявила о неудовлетворительном качестве первого образца. Однако со второй попытки всё прошло успешно — вероятно, именно этот экземпляр и был обработан.

Данные на руках

По завершении процесса я получил доступ к файлам общим весом около 170 ГБ:

55G NG101J7C24_1.fq.gz
56G NG101J7C24_2.fq.gz
57G NG101J7C24.mm2.sortdup.bqsr.cram
1,4M NG101J7C24.mm2.sortdup.bqsr.cram.crai
215M NG101J7C24.mm2.sortdup.bqsr.hc.vcf.gz
1,7M NG101J7C24.mm2.sortdup.bqsr.hc.vcf.gz.tbi

Интерпретация результатов

Платформа Nebula предлагает как базовые отчеты по генетическим признакам (Traits), так и более глубокие анализы предрасположенностей к заболеваниям, а также отчеты по микробиому и географическому происхождению. Истинная ценность владения полным геномом заключается не в красивых дашбордах, а в возможности в любой момент использовать эти данные для сторонних исследований, как текущих, так и будущих.

Происхождение

Раздел этногеномики подтвердил семейное предание: мои предки действительно имели французские и баскские корни, что ярко отразилось в 7%-ном распределении гаплотипов.

Генетические черты и отчеты

Система автоматически сопоставляет ваш геном с сотнями научных работ. Например, можно получить оценку рисков развития бессонницы или некоторых онкологических заболеваний.

Генетические черты
Генетические черты
Бессонница
Бессонница

YFull и глубокая генеалогия

YFull — это глобальный проект для детального анализа Y-хромосомы и мтДНК. Интеграция данных из Nebula происходит практически мгновенно. Здесь я обнаружил поразительные вещи: благодаря «совпаденцам» по мужской линии удалось проследить миграцию предков, которые оказались связаны с тюркоязычными кочевыми племенами — «черными клобуками».

Древо происхождения

Детальный экскурс в историю гаплогрупп

Моя гаплогруппа N долгое время считалась преимущественно «северной» (Финляндия, Эстония, север России), что вводило в заблуждение при попытках локализовать истоки. Однако глубокий филогенетический анализ показал, что мы имеем дело с потомками кочевников из Центральной Азии. Пазырыкская культура, огузские племена — цепочка отслеживается вплоть до времен Киевской Руси. Поразительно, насколько точно генетика дополняет исторические хроники о взаимодействии Руси и степных народов.

Бесплатный софт для анализа

Обладание «сырыми» данными открывает доступ к мощному Open Source инструментарию. Рекомендую обратить внимание на проект Lite Just-Dna — это удобный инструмент для первичного анализа, созданный энтузиастами и профессиональными биоинформатиками (Антон Кулага и Николай Усанов).

Исходный код на Github позволяет самостоятельно и быстро проанализировать свой геном без необходимости установки тяжелого ПО.

Продолжение темы анализа — в следующей части.

Благодарю за внимание!

© 2026 ООО «МТ ФИНАНС»

 

Источник

Читайте также