Как работает геномный браузер?

Привет! Меня зовут Геннадий Захаров, я аналитик и разработчик проекта «Геномный браузер» в компании EPAM, а также сотрудник лаборатории нейрогенетики в Институте физиологии им. И. П. Павлова. Я хочу рассказать о нашем проекте, созданном на стыке науки и технологий, и ответить на все связанные с ним вопросы.

Как работает геномный браузер?

Предыстория

В 2013 году, во время активных преобразований в РАН, у нас в лаборатории дела пошли похуже. Мне стало понятно: последний год занимаюсь тем, что пишу какие-то ужасающие отчеты в неимоверных количествах, а научная работа практически не идет. Появились сомнения в дальнейшей карьере. Примерно в это же время мои знакомые рассказали, что компания GGA Software (в 2014 году стала частью EPAM) срочно нужен человек, знающий современную биологию и при этом умеющий программировать. Я начал работать в компании, а в 2015 году стал аналитиком в команде по созданию геномного браузера.

Со старшей школы я «сижу на клавишах» — это хобби, которое очень сильно помогло в академической жизни. Например, в моей кандидатской порядка 70 графиков, и делать их вручную в Excel — это убиться. Чтобы не париться, я сделал скрипт, который перестраивал и, форматировал все графики сам, тем более моих навыков Python и Google вполне хватало. Также за время работы в лаборатории написал отдельную программу, анализирующую локомоторное поведение дрозофила.

В общем, я решил попробовать себя в качестве аналитика разработки этого самого геномного браузера и человека, который ставит задачи по его созданию. И понял, что мне нравится делать что-то полезное и конкретное, и что документацию, написанную мной, здесь кто-то точно читает.

Как работает и зачем нужен геномный браузер?

ДНК — это 23 пары хромосом. Если говорить совсем просто, то 46 очень длинных ниточек. Ни одна секвенсовая машина (устройство для расшифровки гена) не читает эту ниточку от начала и до конца, но может прочесть очень большое количество коротких фрагментов (прочтений).

Фактически задача секвенирования ДНК заключается в следующем: представьте, что есть 10 000 экземпляров газеты, мы их пропустили через шредер, а появившиеся фрагменты хорошенько перемешали и из них наугад копнули лопатой. Теперь из этих фрагментов нужно восстановить исходный текст газеты. Собственно, алгоритмы секвенирования делают то же самое.

Узнать больше о геномном браузере можно из этого видео

Источник

Читайте также