Не бойтесь машин – технологии ИИ пока ещё не готовы к тому, чтобы думать самостоятельно
Несмотря на предупреждения Илона Маска, сделанные им этим летом, у нас есть не так уж много причин терять сон, беспокоясь по поводу Skynet и терминаторов. Искусственный интеллект (ИИ) ещё далёк от того, чтобы превратиться во вредоносную и всезнающую силу. Единственный апокалипсис, который нам светит – слишком сильная надежда людей на машинное обучение и экспертные системы, что доказали владельцы Tesla, снявшие руки с руля.
Примеры того, что сегодня пытаются выдать за ИИ – такие технологии, как экспертные системы и машинное обучение – прекрасны для создания софта, способного помочь в областях распознавания последовательностей, автоматического принятия решений и общения человека с компьютером. Эти технологии существуют уже несколько десятилетий, и качество их работы зависит от качества входных данных. Поэтому маловероятно, что в ближайшее время ИИ заменит суждения людей по важным вопросам, в которых требуется более сложный ответ, чем «да» или «нет».
Экспертные системы, также известные, как системы на основе правил или системы на основе знаний, представляют собой компьютеры, запрограммированные при помощи явных правил, выработанных людьми-экспертами. Компьютеры могут применять эти правила, только гораздо быстрее и без перерыва, чтобы приходить к тем же выводам, что и эксперты-люди. Представьте, что вы спросили онколога, как она диагностирует рак, а затем запрограммировали медицинское ПО на прохождение тех же шагов. В случае конкретного диагноза онколог может изучить, какие из правил были активированы в процессе его постановки, чтобы подтвердить корректность работы экспертной системы.
Однако для создания и поддержания системы таких правил требуется много времени и специальных знаний, а правильность работы слишком сложных экспертных систем тяжело подтвердить. И, естественно, такие системы не работают вне своих правил.
Лошадка, знающая один трюк
Машинное обучение (МО) позволяет компьютерам прийти к решению – но без предварительного явного программирования. Вместо этого им показывают сотни или тысячи примеров наборов данных, и сообщают, как их можно разбить на категории: «рак/не рак», «этап 1 / этап 2 / этап 3».
Сложные алгоритмы тренируются на этих наборах данных и обучаются тому, как ставить правильные диагнозы. Машинное обучение может тренироваться на наборах данных, даже если эксперт-человек не может объяснить, как было сделано решение. Благодаря увеличению количества и качества собираемых различными организациями данных, машинное обучение продвигает ИИ-технологии во всё расширяющийся набор прикладных применений, которые обещают произвести революцию в индустриях – если их использовать правильно и с умом.
Но у МО есть присущие ему слабости. К примеру, с алгоритмом нельзя провести реверс-инжинириг. Нельзя спросить, каким образом был поставлен определённый диагноз. И не получится задать МО вопрос в области, в которой она не тренировалась.
Классическим примером МО будет классификация изображений по типам «кошка / собака / обе / никто из них». После такой обработки нельзя спросить МО, есть ли на картинке пудель или собака – оно не может адаптироваться к новым вопросам, не проведя тренировку или не добавив ещё один уровень МО к системе.
ИИ-технологии, если рассматривать их, как автоматизацию, могут многое добавить к бизнес-продуктивности. В некоторых областях задач ИИ прекрасно работает, особенно там, где требуемое решение довольно прямолинейное, и не содержит слишком большого количества нюансов.
Тут начинает вырисовываться закономерность
Один из наиболее часто применимых типов МО – распознавание закономерностей, основанное на кластеризации и категоризации данных. Пользователи Amazon уже почувствовали, как аналитику на основе МО можно использовать в продажах: механизм рекомендаций Amazon использует кластеризацию на основе покупок клиента и других данных, определяя продукты, которые могут его заинтересовать.
Такого рода аналитику использовали в физических розничных магазинах годами – некоторые продуктовые магазины размещают продукты на витрине рядом с самыми часто приобретаемыми товарами. Но МО может автоматизировать такие задачи практически в реальном времени.
МО превосходно работает с распознаванием всяких закономерностей – в медицинской обработке изображений, финансовых сервисах (не мошенническая ли это транзакция по банковской карте?), и даже в управлении IT (если нагрузка сервера слишком велика, попробуй эти настройки, пока проблема не исчезнет).
Такого рода автоматизация на основе данных используется вне розничного мира для работы с другими рутинными задачами. К примеру, у стартапа Apstra есть инструменты, использующие МО и аналитику реального времени для автоматической подстройки и оптимизации быстродействия дата-центров, что не только уменьшает потребность в сотрудниках административного отдела, но и уменьшает необходимость обновления оборудования.
Ещё один стартап, Respond Software, предлагает экспертные системы, которые можно использовать в корпоративных центрах обеспечения безопасности для автоматического распознавания и работы с происшествиями, связанными с безопасностью. А Darktrace использует МО для определения подозрительной активности в сетях – система Enterprise Immune System ищет действия, не совпадающие с теми, что проводились в сети до этого, и предупреждает сотрудников службы безопасности о вещах, которые могут их заинтересовать. Модуль Antigena может автоматизировать реагирование на обнаруженные проблемы, разъединяя сетевые связи, похожие на вредоносные.
Человеческий интеллект
МО можно применять и для анализа более человеческого общения. После обширных работ, проведённых специалистами по обработке данных и разработчиков, алгоритмы МО относительно неплохо научились распознавать «настрой» текста – определять, звучит он позитивно или негативно. Это начали применять к «обработке текста» соцсетей и к обработке изображений.
Microsoft Project Oxford создал API для проверки эмоций людей на фотографиях, а также создал API для обработки текста, опознающий его настрой. IBM Watson тоже работает с таким анализом в своём продукте Tone Analyzer, способном ранжировать по эмоциональности твиты, емейлы и другие тексты.
Такого рода технологии интегрируются в системы работы с пользователями, определяющими жалобы пользователя на продукты и услуги и отправляющие информацию людям для ответа. IBM скооперировалась с Genesys, чтобы встроить свою систему Watson в Customer Experience Platform, чтобы позволить персоналу отвечать людям на их вопросы напрямую, и соединять людей с жалобами сразу с теми специалистами, кто сможет ответить им наилучшим образом. Системе приходится учиться у людей на лету, но она постоянно улучшает качество своих ответов – хотя её эффективность всё ещё предстоит проверять.
Даже извечная область деятельности людей, управление персоналом, получает преимущества от ИИ в измерении продуктивности и эффективности работника, проведении оценки результатов деятельности и даже во внедрении умных чатботов, помогающих сотрудникам назначать даты отпусков или высказывать свои проблемы по поводу управления разговорным языком. ИИ стартапы оптимизируют рутинные операции HR: Butterfly предлагает коучинг и менторство, Entelo помогает рекрутёрам просматривать соцсети в поисках кандидатов, Textio помогает писать более эффективные описания вакансий.
Но ИИ плохо работает с неопределённостью, включая отклонения в тренировочных данных или экспертных правил. Разные врачи могут ставить разные диагнозы или рекомендовать разное лечение. Что же нужно делать экспертной диагностической системе?
Широко обсуждаемое применение МО – это фильтрация заявок поступающих в колледж. ИИ тренировали на данных по нескольким годам заявок, включающим оценки за успеваемость, отзывы из школы, и даже сочинения, и сообщали, каких студентов приняли, а каким – отказали.
Целью эксперимента было воспроизвести работу людей, принимающих студентов – и система работала, но она воспроизводила также их недостатки, к примеру, склонность к определённым расовым группам, социально-экономическим классам, и даже таким занятиям, как участие в спортивных командах. Результат: технический успех, а в остальном – эпический провал.
До тех пор, пока не произойдёт прорыва в обработке двусмысленностей или противоречий в правилах и склонностей в тренировочных данных, ИИ будет трудно развиваться.
Требуется помощь
Для улучшения работы, системам МО необходима тренировка на хороших данных. Но чтобы понять эти данные, людям во многих случаях требуется предварительно обработать информацию – назначать нужные метаданные и форматирование, а также направлять алгоритмы МО на нужные части данных для получения лучших результатов.
Многие из подвижек в прикладных областях МО и ИИ произошли благодаря работе, проделанной экспертами-людьми во многих областях, направленной на предоставление более качественных данных в больших объёмах.
Недорогие исторические данные, полученные со спутников, и улучшения в погодных данных, делают возможным для МО предсказывать проблемы с посевами в развивающихся странах. Descartes Labs, используя данные спутников LANDSAT 8, построить мозаику размером в 3,1 триллион пикселей, обозначающую пахотные земли планеты и отслеживать рост растений. Скомбинировав эти данные с метеорологическими, МО компании сумело точно предсказать урожаи кукурузы и сои в США по отдельным округам. С увеличением объёмов недорогих изображений, полученных со спутников, и данных со всепроникающих погодных датчиков, предсказательные системы будут и дальше повышать свою точность – с помощью специалистов по обработке данных и других экспертов-людей.
Предсказания другого сорта могут поменять работу бизнес-предприятий. В недавнем исследовании от Найангского технологического университета Сингапура было показано, что прогнозы на основе МО, использующего нейросети, способны более точно предсказывать запросы производств, что позволяет компаниям лучше планировать производство, чем при помощи экспертных систем или других предсказательных технологий, основанных лишь на исторических данных. Особенно это заметно в индустриях с нестабильным спросом, у которых спрос бывает либо слишком большим, либо слишком маленьким, и очень редко – средним. Такие системы могут находить закономерности сами, без предварительных объяснений о способе моделирования данных.
Такие системы, усложняясь и используя всё больше типов данных, могут дать предприятиям и организациям способность находить закономерности во всё больших наборах данных. Но если мы можем использовать ИИ для помощи в принятии решений в тех областях, в которых мы уже знаем, что нужно делать, мы не можем отправить агентов ИИ в неизвестность, не обеспечивая за ними надзор со стороны людей, которые смогут составить экспертные правила или создать новые наборы тренировочных данных с нуля.
И хотя некоторые ИИ системы, типа IBM Watson или Amazon Alexa могут засасывать огромные объёмы неструктурированных данных из интернета и использовать их для поиска по тексту или построения базы знаний для ответов на вопросы, это не поможет создавать новые тренировочные наборы данных для распознавания образов – пока. Научно-фантастический образ компьютеров, самостоятельно находящих себе свои наборы данных, недостижимы для сегодняшнего ИИ – как и для завтрашнего. Решения, и вопросы, по-прежнему будут создавать люди.
Алан Зейчик – глава аналитической группы Camden Associates, работающей в Финиксе, шт. Аризона. Бывший разработчик и системный аналитик, он был основателем и главным редактором журнала Software Development Times.
Источник