Искусственный интеллект в биотехнологии

Искусственный интеллект в биотехнологии
Источник: LinkedIn Eric Gonzalez

Сегодня искусственный интеллект (Artificial intelligence, AI) широко используется в науках о жизни: рациональный драг-дизайн, функциональная и структурная геномика и прочие омики, анализ медицинских изображений, предсказание третичной структуры белков и многое другое.

История ИИ

Принято считать, что сама область искусственного интеллекта зародилась в 1943 году, когда впервые была предложена математическая модель искусственного нейрона. А в 1956 году во время конференции в Дартмутском колледже Джон Маккарти предложил уже сам термин ИИ, введя его в академический оборот. В дальнейшем сфера претерпела несколько периодов бурного развития и полного застоя.

Американский информатик и автор термина «искусственный интеллект» Джон Маккарти. Источник
Американский информатик и автор термина «искусственный интеллект» Джон Маккарти. Источник

Окончательное возрождение искусственного интеллекта произошло в десятые годы XXI в., когда алгоритмы машинного обучения вошли без преувеличения в каждый дом: тут можно вспомнить системы распознавания лиц, обработки речи (Alexa, Siri), потребительских прогнозов (Netflix), машинного перевода (Google Переводчик). С тех пор сфера только развивается: лучшее подтверждение — нашумевший ChatGPT.

Искусственный интеллект, машинное и глубокое обучение

Обыватели часто смешивают понятия искусственный интеллект, машинное и глубокое обучение, оперируя ими как синонимами. Но на самом деле эти термины самостоятельны, хотя и вложены друг в друга по принципу матрешки.

Диаграмма Венна для области искусственного интеллекта (ИИ). Источник
Диаграмма Венна для области искусственного интеллекта (ИИ). Источник

Наиболее широко трактуется искусственный интеллект (ИИ, или AI). Под ним подразумеваются интеллектуальные системы, которые могут выполнять задачи, требующие творческого начала. Но пока машины не достигли уровня человеческого разума, и многие специалисты полушутя расшифровывают аббревиатуру ИИ как «имитация интеллекта».

Машинное обучение (Machine learning, ML) — одно из направлений ИИ, когда компьютеры могут сами распознавать шаблоны, находить закономерности в массивах данных и делать прогнозы. Яркий пример того, что ИИ не всегда тоже самое, что машинное обучение, — шахматы. В 1997 году действующий чемпион мира Гарри Каспаров потерпел поражение от IBM Deep Blue — ИИ, но без всякого машинного обучения.

Подобласть машинного обучения — глубокое обучение (Deep learning, DL). Это искусственные нейронные сети. Такие системы повторяют работу нейронов коры головного мозга, когда есть много слоев, и каждый слой получает переработанную информацию от предыдущего. Для глубокого обучения нужно гораздо больше данных, чем просто машинному обучению.

Далее поговорим о том, где ИИ нашел себя в биотехе. И начнем с растениеводства, где искусственный интеллект, по мнению специалистов, может решить проблему продовольственной безопасности. Потом рассмотрим лесное хозяйство и животноводство. А на закуску оставим, пожалуй, самое воодушевляющее направление — медицину.

Мониторинг состояния растений

В агротехе широко применимы алгоритмы компьютерного зрения (CV) на основе сверточных нейронных сетей (CNN). Компьютерное зрение может обнаруживать, автоматически идентифицировать и классифицировать объекты на изображениях, получаемых, например, с камер дронов. Как это работает?

Беспилотные летательные аппараты (БПЛА) облетают плантации по заданным маршрутам и осуществляют аэрофотосъемку, а ИИ анализирует и интерпретирует полученную информацию. Этот подход дает возможность удаленно мониторить состояние посевов, производить более точное прогнозирование урожайности, а также обнаруживать недостаток удобрений или наличие заболеваний и вредителей у сельскохозяйственных культур на огромных территориях.

А наземные роботы, «напичканные» датчиками, могут легко обнаружить сорняки и использовать ИИ для умного опрыскивания и прополки. Камера, установленная на машине-опрыскивателе, при детектировании сорного растения записывает его геолокацию, анализирует размеры и цвет, чтобы произвести расчет и внести точное количество гербицидов, необходимое для его уничтожения. Это позволяет сократить использование химикатов и сэкономить время.

Алгоритмы определяют степень зрелости томатов. Источник
Алгоритмы определяют степень зрелости томатов. Источник

Компьютерное зрение с высокой точностью определяет зрелость плодов и сроки их уборки. Уже созданы роботы c множеством датчиков и искусственным интеллектом, которые перемешаются по теплице. Проанализировав положение плодов в пространстве и степень их поспевания, машины осуществляют захват фруктов или овощей, а потом и сортировку. Роботизированные сборщики урожая смогут решить трудовую проблему, особенно ярко проявившуюся во время пандемии, когда фермеры столкнулись с острой нехваткой рабочей силы.

Высокопроизводительное фенотипирование в селекции

Принципы HTP. Источник
Принципы HTP. Источник

«Как соотносятся генотип и фенотип?» — одна из краеугольных проблем современной селекции растений. Традиционные инструменты фенотипирования основывались на ручном измерении отдельных фенотипических признаков небольшой выборки растений на определенных стадиях онтогенеза, что давало лишь ограниченную информацию и к тому же заставляло повреждать побеги.

Сегодня широкое распространение получило высокопроизводительное фенотипирование (High-throughput phenotyping, HTP), обеспечивающее цифровой автоматизированный анализ гигантских выборок растений для массовых селекционно-генетических экспериментов. HTP подразумевает оценку сразу множества признаков от клеточного уровня вплоть до целых растительных сообществ. Метод позволяет найти закономерности между морфологическими, химическими и физиологическими свойствами тысяч растений и условиями среды.

Как собирают большие данные для фенотипирования. Источник
Как собирают большие данные для фенотипирования. Источник

Сбором данных при HTP занимаются беспилотные летательные аппаратами в сочетании с алгоритмами компьютерного зрения, а также наземные роботы, оснащенные несколькими датчиками и неинвазивными сенсорами, которые могут делать замеры на всем участке несколько раз в день или в течение всего сезона от всходов до созревания. Это приводит к огромному количеству пространственных и временных данных для анализа и хранения, эффективно разобраться с которыми помогает также машинное обучение.

Объединение результатов фенотипирования на основе изображений и информации с полевых датчиков с геномными и прочими омиксными данными о реакциях растений на условия среды (экспрессия генов, биосинтез метаболитов и т.д.) позволяет оптимизировать селекционный процесс и выявить новые фенотипы сельхозкультур, которые более эффективно используют ресурсы и устойчивы к меняющимся климатическим условиям.

Культура клеток растений in vitro

Чтобы быстро размножить растения в промышленных масштабах применяется биотехнологический метод — микроклональное размножение.

Диаграмма Исикавы, на которой перечислены основные факторы, влияющих на культуру тканей клеток растений и подлежащие моделированию с помощью ИИ. Источник
Диаграмма Исикавы, на которой перечислены основные факторы, влияющих на культуру тканей клеток растений и подлежащие моделированию с помощью ИИ. Источник

Здесь очень сложной задачей является подбор сред для культивирования тканей растений, поскольку нужно учесть множество факторов и их взаимодействие (фитогормоны, макро- и микроэлементы, витамины, аминокислоты). Модели ИИ могут имитировать и прогнозировать рост и развитие тканей растений in vitro в различных условиях для оптимизации питательных сред.

Животноводство

Животноводство — важный сектор сельского хозяйства и крупнейший в мире землепользователь. Чтобы поддерживать его рентабельность без вреда окружающей среде, отрасль должна производить больше с использованием меньшего количества ресурсов и вдобавок сокращать отходы.

Блок-схема процессов, которые подлежат оценке при LCA, на примере молочной фермы. Источник
Блок-схема процессов, которые подлежат оценке при LCA, на примере молочной фермы. Источник

Для интенсификации применяется LCA (Life-cycle assessment) — оценка жизненного цикла продукта. Это инструмент, позволяющий измерить экологический след на протяжении всех стадий от фермы до вилки: выращивание культур для производства кормов, здоровье животных, транспортировка, обработка и хранение пищевых продуктов.

Мониторинг создает большие данные, которые можно анализировать с помощью ИИ, чтобы переходить к более замкнутым циклам (за счет сокращения затрат и экономии ресурсов) и снижению выбросов парниковых газов.

Лесное хозяйство

Леса имеют планетарное экологическое значение, а древесина активно используется в хозяйстве. Однако возобновление не поспевает за обезлесением. Искусственный интеллект используется для анализа данных спутниковых снимков, фото с дронов и информации с наземных датчиков, чтобы прогнозировать рост и урожайность деревьев, а также места возгораний.

Схема работы системы мониторинга и предсказания лесных пожаров. Источник
Схема работы системы мониторинга и предсказания лесных пожаров. Источник

В 2019-20 гг. Австралию охватила волна лесных пожаров, нанесших серьезный ущерб экосистемам: выгорело 190 тыс. кв. км леса на сумму более 20 млрд долларов. Оперативно была создана система Vesta Mark 2, которая объединяет исторические справки о пожарах за последние 40 лет, данные о состоянии лесного покрова и наиболее уязвимых местах возгораний с прогнозами погоды. На основе этой информации модель прогнозирует потенциальные очаги и скорость распространения пожара и шлет уведомления лесничим, чтобы они были готовы быстро выехать и потушить пламя.

Медтех

ИИ в медицине — популярное и динамично развивающееся направление, ведь оно напрямую касается здоровья человека. За годы работы медучреждений накапливается множество числовых и текстовых данных, например, результаты биохимических анализов, истории болезней или рентгеновские снимки пациентов. Алгоритмы могут анализировать эти массивы и находить скрытые закономерности, которые человек попросту не замечает.

Диагностика рака становится доступнее благодаря умному приложению на смартфоне. Источник
Диагностика рака становится доступнее благодаря умному приложению на смартфоне. Источник

Особенно поражает воображение применение нейросетей для анализа медицинских изображений. Теперь, например, по обычной фотографии покровов тела, сделанной на смартфон, специальные мобильные приложения могут определять рак кожи без проведения биопсии и способствовать ранней диагностике заболевания. Недавно была создана модель ИИ, которая анализирует компьютерные томографии легких и может отличать раковые узлы от доброкачественных образований, что значительно упрощает работу врачам при постановке диагнозов.

Еще ИИ можно использовать для анализа данных из различных источников, таких как электронные медицинские карты и носимые устройства, для выявления закономерностей и корреляций, которые могут указывать на наличие определенной патологии или риск ее развития.

Машинное обучение и нейросети в RnD лекарств. Источник
Машинное обучение и нейросети в RnD лекарств. Источник

Еще одна сфера: RnD лекарств. Разработка нового фармпрепарата — чрезвычайно длительный и дорогостоящий процесс, о чем мы недавно писали в статье. Однако отдельные его этапы можно ускорить с помощью ИИ, например, предсказание терапевтических мишеней. Использование нейросетей для интеграции разнообразных омиксных данных позволяет составить лучшее понимание механизмов болезней и определить потенциальные лекмишени.

ИИ пригоден и для рационального драг дизайна in silico. Химические библиотеки сегодня содержат миллиарды молекул, поэтому необходимы максимально эффективные подходы к виртуальному тестированию. Методы компьютерного обнаружения лекарств (CADD) способны значительно ускорить темпы скрининга новых препаратов. Например, платформа Deep Docking проводит экономичный молекулярный докинг и обеспечивает ускорение скрининга с помощью QSAR-модели в 50-100 раз. Это достигается за счет предварительного отбрасывания плохо «стыкуемых» молекул и окончательного докинга только ограниченного подмножества лигандов с наивысшими рангом.

Deep Docking ускоряет докинг во много раз. Источник
Deep Docking ускоряет докинг во много раз. Источник

Заключение

Таким образом, бум машинного обучения и нейросетей в нашем тысячелетии стал возможен благодаря доступности огромного количества данных, совершенствованию технологий их хранения, повсеместной цифровизации и все более высоким вычислительным мощностям. Сегодня буквально каждый день появляются новости об очередных достижениях в сфере искусственного интеллекта. Надеемся, что и в биотехе ИИ будет только процветать.

 

Источник

Читайте также