В Санкт-Петербурге с 27 по 29 марта пройдет хакатон для биологов, программистов и биоинформатиков BioHack. Мероприятие организуют Институт биоинформатики и международная IT-компания EPAM. Биоинформатика — это нефть, золото и биткоины для фармацевтики, диагностики и генетики в целом. О том, зачем идти на хакатон, если вы не понимаете в коде или наоборот — биологии, о трудностях перевода и том, чего можно добиться всего за 48 часов хакатона, рассказала его участница — Елизавета Старикова, младший научный сотрудник лаборатории геномных исследований и вычислительной биологии ФНКЦ физико-химической медицины.
Точка входа
Я всегда следила за деятельностью Института биоинформатики, и однажды получила приглашение представить проект на BioHack. У меня была идея, до реализации которой совсем не доходили руки, и я подумала: «Почему бы не реализовать ее на Биохаке?» После этого мы с коллегами написали заявку, причем старались объяснить тему понятно, чтобы участникам хакатона было интересно.
Участники сами выбирали темы, которые им нравятся, а организаторы хакатона распределяли их по командам. В итоге над каждым проектом работали и биологи, и программисты.
К практике и транспозонам
В прошлом году я представила проект по транспозонам. Транспозоны — это участки ДНК, способные к передвижению и размножению внутри ДНК. Грубо говоря, это элементы, которые размножаются и «скачут» из одного места в другое.
Идея для хакатона заключалась в разработке инструмента для поиска бактериальных транспозонов в общем виде, поскольку такого инструмента, насколько мне известно, нет.
Для чего это нужно? Например, для того, чтобы проверить гипотезу, являются ли они серьезным вектором распространения устойчивости к антибиотикам. Чтобы подтвердить гипотезу, сначала нужно найти эти транспозоны. Тут и требуется программа.
Сперва мы идентифицировали гены, которые есть у транспозонов, потом стали искать повторяющиеся участки ДНК вокруг них: это говорит о том, что транспозон начинается или заканчивается. Но, увы, такие гены искались плохо. На основе сравнительно малого количества данных мы пытаемся понять все разнообразие траспозонных генов. Это непросто, но начало положено, и это круто.
В поисках бактериофагов
Этот проект был запущен на хакатоне в 2017 году, и работа над ним продолжается до сих пор. Вместе с участниками Биохака мы написали прототип программы на Python, которая ищет скрытые формы бактериофагов. Бактериофаги — это вирусы, избирательно поражающие бактериальные клетки. Некоторые из таких вирусов сейчас применяют в качестве альтернативы антибиотикам. В работе мы использовали биоинформатический pipeline и несколько скриптов.
Изначально нас интересовало, могут ли бактериофаги распространять устойчивость к антибиотикам. Это предположение частично подтверждалось и частично опровергалось недавно вышедшими научными статьями, которые широко обсуждали в сообществе. Мне очень хотелось во всем разобраться, но сначала предстояло научиться искать эти бактериофаги. Наша команда написала скрипт, ищущий такие формы бактериофагов, которые покоятся внутри ДНК бактерии. Использовалось «окошко», скользящее по бактериальному геному и ищущее скопления генов, похожих на гены бактериофага. В итоге мы заняли с проектом второе место.
Вопрос о распространении устойчивости к антибиотикам так и остался неясным, но созданная программа оказалась очень полезной для многих задач. Сейчас мы используем ее в метагеномике (прим.: раздел молекулярной генетики, в котором изучается генетический материал, полученный из образцов окружающей среды). Например, берем биообразцы человека и выделяем всю ДНК, которая там есть: и от бактерий, и от вирусов, и от самого человека, и даже от некоторых грибов. Мы секвенируем эту ДНК и получаем огромный массив данных. Его довольно сложно осмыслить, но программа помогает нам в нем разобраться — по крайней мере, отличить некоторые вирусы от бактерий.
Нетворкинг 24/2
Хакатон — это отличный опыт для биологов, химиков, медиков, информатиков с точки зрения расширения кругозора и связей, который помогает им осознать возможности изучения биологии за счет программных инструментов, находить новые решения для своих проектов. Но самое главное — это нетворкинг. Я лично познакомилась с людьми, которые работают в той же области, мы до сих пор общаемся.
Ребята-программисты, как правило, не очень много знают про биологию, но им было интересно попробовать себя в разных областях. Так же и биологи не всегда могут ориентироваться в терминах или том, какое именно техническое решение может помочь их задаче. И я была коммуникатором в команде. Навык такого «перевода» тоже полезен в работе.
Дважды хакатон приходился на мой день рождения, и организаторы поздравляли меня тортиком. Это было очень приятно.
В этом году я тоже планирую участвовать. У меня масса рабочих задач, сейчас я выбираю, какая из них подойдет лучше всего.
Успейте зарегистрироваться на хакатон до 28 февраля! Проводится конкурсный отбор. Подробности на сайте и в сообществе «ВКонтакте».