Добро пожаловать на пятничное чтиво 👍. Почему этот перевод на Хабре? Вслед за OpenAI DevDay, прошедшем 6.11.2023, в блоге Билла Гейтса вышла большая статья о влиянии ИИ на пользовательский опыт в ближайшие несколько лет. Можно по-разному относиться к тому, что пишет Б.Гейтс о будущем, но благодаря партнерству Microsoft и OpenAI, он “что-то знает”.
Т.е., в курсе того будущего, каким его видит Сэм Альтман, глава OpenAI: «Мы сделаем ИИ-агентов, которые смогут самостоятельно взаимодействовать с миром». Изменят ли агенты, т.е. персональные ИИ-ассистенты, мир компьютеров кардинально, мы узнаем на практике. А пока можем проследить за мыслью основателя Microsoft и подискутировать в комментариях.
Дисклеймер: Некоторые термины были дополнены в переводе для лучшего понимания контекста (дополнительный текст в скобках).
От автора перевода: Чтобы выполнять весь набор интеллектуальных действий за людей, в видении автора (и OpenAI) предполагается, что ИИ-агенты получат неограниченный доступ к частной жизни пользователей. Иначе агенты просто не будут эффективны. Согласны ли вы на такое вторжение в частную жизнь — напишите в комментариях. Просьба не минусовать статью, если вы не разделяете это видение будущего с Б.Гейтсом. Это всего лишь перевод, коллеги.
Персональный помощник для каждого
ИИ-агенты в здравоохранении
ИИ в образовании
Продуктивность
Развлечения и покупки с ИИ-агентом
Изменения в технологической отрасли будут похожи на взрыв
Технические вызовы при внедрении агентов
Конфиденциальность и другие важные вопросы
Заключение
Мне и сегодня интересно программное обеспечение так же сильно, как и тогда, когда мы с Полом Алленом основали компанию Microsoft. Но, несмотря на то, что за прошедшие с тех пор десятилетия программное обеспечение значительно улучшилось, во многих отношениях оно все еще остается довольно «туповатым».
Почему я так считаю? Чтобы выполнить любую задачу на компьютере, необходимо указать устройству, какое приложение использовать. Вы можете использовать Microsoft Word и Google Docs для составления коммерческого предложения, (но их функциональность этим и ограничена), они не помогут вам отправить электронное письмо, поделиться селфи, проанализировать данные, запланировать вечеринку или купить билеты в кино. И даже самые лучшее ПО имеет неполное представление о вашей работе, личной жизни, интересах и взаимоотношениях и не способно использовать эту информацию для решения ваших задач. Такие вещи сегодня возможны только с другим человеком, например с персональным помощником (сотрудником).
В ближайшие пять лет ситуация полностью изменится. Вам не придется использовать различные приложения для решения разных задач. Вы просто будете говорить своему устройству на естественном языке, что вы хотите сделать. И в зависимости от того, каким объемом информации вы решите поделиться с устройством, ПО сможет реагировать индивидуально, поскольку будет иметь богатое представление о вашей жизни. В ближайшем будущем любой человек, работающий в Интернете, сможет получить персонального помощника, оснащенного искусственным интеллектом, который намного превосходит современные технологии.
Такое программное обеспечение — то, что реагирует на естественный язык и может выполнять множество различных задач, основываясь на своих знаниях о пользователе, — называется агентом. Я размышлял об агентах почти 30 лет назад и написал о них в своей книге 1995 года «The Road Ahead«, но практическое применение они получили только недавно, благодаря достижениям в области искусственного интеллекта.
Агенты не только изменят взаимодействие людей с компьютерами. Они также перевернут индустрию программного обеспечения и произведут крупнейшую революцию в вычислительной технике с тех пор, как мы перешли от ввода команд (MS-DOS) к нажатию на иконки (Windows).
Персональный помощник для каждого
Мои критики отмечают, что компании-разработчики уже предлагали подобные устройства, и пользователи не очень-то их принимали. Пользователи до сих пор шутят о Clippy, цифровом помощнике, который мы включили в Microsoft Office, а потом отказались от него. Почему же люди будут использовать агентов?
Ответ заключается в том, что они будут значительно лучше. С ними можно будет вести вполне конкретные разговоры. Они будут гораздо более персонализированными и не будут ограничиваться относительно простыми задачами вроде написания письма. У Clippy столько же общего с агентами, сколько у дискового телефона с мобильным устройством.
Агент сможет помогать вам во всех ваших делах, если вы этого захотите. Получив разрешение следить за вашими действиями в Интернете и в реальном мире, он сможет составить представление о людях, местах и видах деятельности, которыми вы занимаетесь. Он узнает о ваших личных и рабочих отношениях, увлечениях, предпочтениях и расписании. Вы сами будете выбирать, как и когда вмешаться, чтобы помочь агенту принять решение.
Чтобы понять, насколько серьезные изменения принесут агенты, давайте сравним их с имеющимися сегодня инструментами искусственного интеллекта. Большинство из них — это боты. Они ограничены одним приложением и, как правило, вступают в работу только тогда, когда вы пишете определенное слово или просите о помощи. Поскольку они не запоминают контекст, как вы их используете в дальнейшем, они не становятся лучше и не учатся вашим предпочтениям. Clippy был ботом, а не агентом.
Агенты умнее. Они работают на опережение и способны делать предложения до того, как вы их попросите. Они выполняют задачи в разных приложениях. Они совершенствуются со временем, поскольку запоминают ваши действия, распознают намерения и модели поведения. На основе этой информации они предлагают то, что, по их мнению, вам нужно, хотя окончательное решение всегда остается за вами.
Представьте себе, что вы хотите спланировать путешествие. Бот для путешествий определит отели, которые соответствуют вашему бюджету. Агент узнает, в какое время года вы собираетесь путешествовать, и, основываясь на своих знаниях о том, всегда ли вы пробуете новые направления или любите возвращаться в одно и то же место неоднократно, сможет предложить места. В ответ на ваш запрос система порекомендует, чем можно заняться, исходя из ваших интересов и склонности к приключениям, а также забронирует экскурсию, которая вам понравится. Если вы хотите получить подобный способ индивидуального планирования сегодня, вам придется обратиться к сотруднику турагентства и потратить время на то, чтобы рассказать о своих пожеланиях.
Самое интересное влияние ИИ-агентов заключается в том, что они демократизируют услуги, которые сегодня слишком дороги для большинства людей. Особенно большое влияние они окажут в четырех областях: здравоохранение, образование, производительность труда, развлечения и покупки.
ИИ-агенты в здравоохранении
Сегодня основная роль ИИ в здравоохранении — это помощь в решении административных задач. Например, Abridge, Nuance DAX и Nabla Copilot могут записывать аудио во время приема и затем составлять заметки для врача.
Настоящий сдвиг произойдет, когда агенты смогут помогать пациентам выполнять базовую сортировку, получать советы по решению проблем со здоровьем и принимать решения о необходимости лечения. Эти агенты также помогут медицинским работникам принимать решения и быть более продуктивными. Уже сейчас такие приложения, как Glass Health, могут анализировать резюме пациента и предлагать диагнозы для рассмотрения врачом. Помощь пациентам и медицинским работникам будет особенно полезна для жителей развивающихся стран, где многие вообще не имеют возможности посетить врача (по причине расстояний или стоимости приема) .
Эти программы-агенты будут внедряться медленнее, чем другие, потому что их правильная работа — это вопрос жизни и смерти. Люди должны увидеть доказательства того, что медицинские агенты в целом полезны, даже если они не будут совершенны и будут допускать ошибки. Конечно, люди тоже совершают ошибки, и отсутствие доступа к медицинской помощи — тоже проблема.
Психотерапевтическая помощь — еще один пример услуги, которую агенты сделают доступной практически для всех. Сегодня еженедельные сеансы психотерапии кажутся роскошью. Однако потребность в них еще не удовлетворена, и многие люди, которым терапия могла бы помочь, не имеют к ней доступа.
ИИ-агенты, хорошо натренированные в теме психического здоровья, сделают терапию гораздо более доступной и легкой. Wysa и Youper — два первых чат-бота в этой области. Но агенты пойдут гораздо глубже. Если вы решите поделиться с агентом по психическому здоровью достаточной информацией, он поймет историю вашей жизни и ваших отношений. Он будет доступен, когда вам это нужно, и никогда не будет проявлять нетерпения. С вашего разрешения, он даже сможет отслеживать физическую реакцию на терапию с помощью ваших умных часов — например, если ваше сердце начинает учащенно биться, когда вы обсуждаете проблему с начальником, — и подсказывать, когда вам следует обратиться к настоящему психотерапевту (врачу).
ИИ в образовании
На протяжении десятилетий я с воодушевлением рассказывал о том, как программное обеспечение может облегчить работу преподавателей и помочь учащимся в обучении. Программное обеспечение не заменит учителей, но дополнит их работу, персонализируя ее для учащихся и освобождая учителей от бумажной работы и других обязанностей, чтобы они могли уделять больше времени наиболее важным аспектам своей работы. Эти изменения наконец-то начинают происходить в значительной степени.
На сегодняшний день в этом направлении работает Khanmigo, текстовый бот, созданный Академией Хана. Он может обучать студентов математике, естественным и гуманитарным наукам. Например, объяснять квадратичную формулу и составлять математические задачи для тренировки. Он также может помогать преподавателям, например, составлять планы уроков. Я давно являюсь поклонником сторонником работы Сала Хана и недавно пригласил его в свой подкаст, чтобы поговорить об образовании и искусственном интеллекте.
Но текстовые боты — это только первая волна: агенты откроют гораздо больше возможностей для обучения.
Например, немногие семьи могут оплатить услуги репетитора, который работает с учеником один на один, дополняя его работу в классе. Если агенты смогут уловить, что делает репетитора эффективным, они откроют доступ к этому дополнительному обучению для всех желающих. Если ИИ-агент-репетитор знает, что ребенок любит Minecraft и Тейлор Свифт, он будет использовать Minecraft для обучения вычислению объема и площади фигур, а тексты песен Тейлор — для обучения рассказыванию историй и рифмованию. Такой опыт будет гораздо более насыщенным, например, графикой и звуком, и более персонализированным, чем у современных текстовых репетиторов (ПО учебных курсов).
Продуктивность
В этой области уже существует серьезная конкуренция. Microsoft делает свой Copilot частью Word, Excel, Outlook и других сервисов. Google делает аналогичные вещи с помощником Bard и его инструментами продуктивности. Эти «вторые пилоты» могут многое — например, превратить письменный документ в слайд-деск, ответить на вопросы по электронной таблице, используя естественный язык, и обобщить потоки электронной почты, представляя точку зрения каждого человека.
Агенты будут делать еще больше. Наличие такого агента — это как наличие человека, который будет помогать вам в решении различных задач и выполнять их самостоятельно, если вы этого захотите. Если у вас есть идея бизнеса, агент поможет вам написать бизнес-план, создать презентацию и даже сгенерировать изображения того, как может выглядеть ваш продукт. Компании смогут предоставлять агентов своим сотрудникам для прямых консультаций и участвовать в каждой встрече, чтобы они могли ответить на вопросы.
«Если вашей подруге только что сделали операцию, ваш ИИ-агент предложит прислать цветы и сможет заказать их за вас»..
Независимо от того, работаете вы в офисе или нет, ваш ИИ-агент сможет помочь вам так же, как сегодня личные помощники помогают руководителям. Если вы скажете, что хотели бы встретиться со своим бывшим соседом по комнате в колледже, он вместе с его агентом подберет время для встречи, а перед самым вашим приходом напомнит, что его старший ребенок только что поступил в колледж при местном университете (как тема для беседы).
Развлечения и покупки с ИИ-агентом
Уже сейчас искусственный интеллект может помочь вам выбрать новый телевизор и порекомендовать фильмы, книги, передачи и подкасты. Компания Likewise, в которую я инвестировал средства, недавно запустила приложение Pix, позволяющее задавать вопросы («Какие фильмы с Робертом Редфордом мне нравятся и где их можно посмотреть?»), а затем давать рекомендации на основе того, что вам нравилось в прошлом. В Spotify есть диджей с искусственным интеллектом, который не только проигрывает композиции в соответствии с вашими предпочтениями, но и разговаривает с вами и даже может называть вас по имени.
Агенты не просто дают рекомендации, они помогают вам действовать в соответствии с ними. Если вы хотите купить фотоаппарат, агент прочитает все отзывы о товаре, обобщит их, даст рекомендацию и оформит заказ, как только вы примете решение. Если вы скажете агенту, что хотите посмотреть «Звездные войны», он узнает, подписаны ли вы на нужный сервис потокового вещания, а если нет, то предложит подписаться. А если вы не знаете, что хотите посмотреть, он сделает индивидуальные предложения, а затем придумает, как включить выбранный вами фильм или передачу.
Кроме того, вы сможете получать новости и развлекательные материалы с учетом ваших интересов. CurioAI, создающий индивидуальный подкаст на любую тему, о которой вы спросите, — это лишь проблеск грядущего.
Изменения в технологической отрасли будут похожи на взрыв
Агенты смогут помочь практически в любой деятельности и в любой сфере жизни. При этом, последствия для софтверного бизнеса и общества будут огромными.
В компьютерной индустрии мы говорим о платформах — технологиях, на которых строятся приложения и сервисы. Android, iOS и Windows — это сегодняшние платформы. Следующей платформой станут агенты.
«Чтобы создать новое приложение или услугу, вы просто скажете своему агенту, что вы хотите»..
тобы создать новое приложение или услугу, вам не нужно будет писать код или заниматься графическим дизайном. Вы просто скажете своему агенту, что вы хотите получить в итоге. Он сможет написать код, разработать внешний вид приложения, создать логотип и опубликовать приложение в интернет-магазине. Запуск OpenAI GPTs на этой неделе дает возможность заглянуть в будущее, где обычные люди смогут легко создавать собственных помощников и делиться ими (включая возможность продавать).
Агенты повлияют на то, как мы используем программное обеспечение, а также на то, как оно создается. Они заменят поисковые сайты, потому что будут лучше находить информацию и обобщать ее для вас. Они заменят многие сайты электронной коммерции, поскольку будут находить для вас лучшую цену и не будут ограничиваться лишь несколькими поставщиками. Они заменят текстовые процессоры, электронные таблицы и другие приложения для повышения производительности. Бизнес, который сегодня существует отдельно — поисковая реклама, социальные сети с рекламой, покупки, программы для повышения производительности — все это станет единым бизнесом.
Я не думаю, что какая-то одна компания будет доминировать в бизнесе агентов. Будет множество различных движков искусственного интеллекта. Сегодня агенты встраиваются в другие программы, такие как текстовые процессоры и электронные таблицы, но со временем они будут работать сами по себе. Хотя некоторые агенты будут бесплатными (и поддерживаться рекламой), я думаю, что за большинство из них вы будете платить, а значит, у компаний будет стимул заставлять агентов работать от вашего имени, а не от имени рекламодателя. Если судить по количеству компаний, которые начали работать над ИИ только в этом году, конкуренция будет исключительно высокой, что сделает агентов очень дешевыми.
Но прежде чем сложные агенты, о которых я рассказываю, станут реальностью, нам необходимо решить ряд вопросов о технологии и о том, как мы будем ее использовать. Я уже писал о проблемах, которые поднимает ИИ, поэтому здесь я сосредоточусь именно на агентах.
Технические вызовы при внедрении агентов
Никто еще не придумал, как будет выглядеть структура данных для агента. Для создания персональных агентов необходима база данных нового типа, способная учесть все нюансы ваших интересов и отношений и быстро вспомнить информацию, сохранив при этом конфиденциальность. Мы уже видим новые способы хранения информации, такие как векторные базы данных, которые, возможно, лучше подходят для хранения данных, генерируемых моделями машинного обучения.
Еще один открытый вопрос касается количества агентов, с которыми будут взаимодействовать люди. Будет ли ваш персональный агент существовать отдельно от вашего терапевта и репетитора по математике? Если да, то когда вы захотите, чтобы они работали друг с другом, а когда они должны действовать раздельно?
«Если вашему агенту необходимо связаться с вами, он вызовеит вас голосом или появится на экране вашего телефона».
Как вы будете взаимодействовать со своим агентом? Компании изучают различные варианты, включая приложения, очки, кулоны, и даже голограммы. Все это возможно, но я думаю, что первым большим прорывом в области взаимодействия человека и агента станут наушники. Если вашему агенту необходимо связаться с вами, он вызовет вас голосом или появится на вашем телефоне. (например: «Ваш рейс задерживается. Вы хотите подождать или я могу помочь вам перебронировать его?») По вашему желанию он будет отслеживать качество звука и улучшать его, блокируя фоновый шум, усиливая речь, которую трудно расслышать, или облегчая понимание человека, говорящего с сильным акцентом.
Существуют и другие проблемы. Пока не существует стандартного протокола, позволяющего агентам разговаривать друг с другом. Необходимо снизить стоимость агентов, чтобы они были доступны каждому. Необходимо упростить процесс подсказки агенту, чтобы он мог дать правильный ответ. Нам нужно предотвратить “галлюцинации ИИ” (выдачу фактов, которые ИИ просто придумал), особенно в таких областях, как здравоохранение, где точность очень важна, и убедиться, что агенты не причиняют вреда людям в результате своих настроек. И мы не хотим, чтобы агенты могли делать то, что им не положено. (Хотя я меньше беспокоюсь об агентах-изгоях, чем о людях-преступниках, использующих агентов в злонамеренных целях).
Конфиденциальность и другие важные вопросы
С учетом всего сказанного, вопросы конфиденциальности и безопасности в Интернете станут еще более актуальными, чем сейчас. Вы захотите иметь возможность определять, к какой информации имеет доступ агент, чтобы быть уверенным в том, что ваши данные передаются только тем людям и компаниям, которых вы выбрали.
Но кому принадлежат данные, которыми вы делитесь с агентом, и как убедиться, что они используются надлежащим образом? Никто не хочет получать рекламу, связанную с тем, что он рассказал своему агенту-терапевту. Могут ли правоохранительные органы использовать вашего агента в качестве улики против вас? В каких случаях ваш агент откажется делать то, что может нанести вред вам или кому-либо еще? Кто выбирает ценности, заложенные в агентов?
Также возникает вопрос о том, каким объемом информации должен делиться ваш агент. Предположим, вы хотите увидеться с подругой: Если ваш агент разговаривает с ней, вы не хотите, чтобы агент сказал: «О, она встречается с другими друзьями во вторник и не хочет приглашать вас». А если ваш агент помогает вам составлять электронные письма по работе, ему необходимо знать, что он не должен использовать личную информацию о вас или служебные данные с предыдущего места работы.
Многие из этих вопросов уже находятся в центре внимания технологической индустрии и законодателей. Недавно я вместе с другими технологическими лидерами участвовал в форуме по ИИ, организованном сенатором Чаком Шумером, на котором присутствовали многие сенаторы США. Мы обменялись мнениями по этим и другим вопросам и говорили о необходимости принятия законодателями сильных законов.
Но не все вопросы будут решаться компаниями и правительствами. Например, агенты могут повлиять на то, как мы взаимодействуем с друзьями и родственниками. Сегодня вы можете показать человеку, что он вам небезразличен, запомнив детали его жизни — например, день рождения. Но когда они узнают, что это ваш агент, скорее всего, напомнил вам об этом и позаботился об отправке цветов, будет ли это столь же значимо для них?
В отдаленном будущем агенты могут даже заставить человека столкнуться с глубокими вопросами о предназначении. Представьте себе, что агенты стали настолько хороши, что каждый может иметь высокое качество жизни, не работая почти столько же. Что будут делать люди в таком будущем? Будет ли кто-то по-прежнему стремиться получить образование, если все ответы на все вопросы будут у агента? Может ли существовать безопасное и процветающее общество, когда у большинства людей будет много свободного времени?
Заключение
До будущего, которое я описал, еще очень далеко. Тем временем агенты появляются. В ближайшие несколько лет они полностью изменят нашу жизнь, как в Интернете, так и вне его.
Спасибо, что дочитали до конца.