ChatGPT научился распознавать рукописные записи, решать математические задачи и анализировать скриншоты с программными ошибками

Новые модели o3 и o4-mini от компании OpenAI позволяют ChatGPT воспринимать изображения так же, как это делает человек. OpenAI анонсировала две усовершенствованные модели, o3 и o4-mini, способные анализировать и интерпретировать визуальные данные на уровне человеческой логики.

Эти модели способны распознавать и разбивать на детали загруженные пользователем изображения, будь то фотографии, диаграммы или скриншоты, и предоставлять подробные анализы. Например, теперь ChatGPT в состоянии читать и расшифровывать рукописные заметки, решать визуальные математические примеры и выявлять ошибки на скриншотах программного обеспечения.


ChatGPT научился распознавать рукописные записи, решать математические задачи и анализировать скриншоты с программными ошибками
Изображение Midjourney

Эти модели интегрируют визуальную информацию в процесс анализа, позволяя манипулировать изображениями — вращать их или изменять масштаб — для более глубокого понимания содержания. Это улучшает точность и полноту ответов, даже при работе со сложными или нечеткими изображениями.

Указанные возможности уже доступны для пользователей подписок ChatGPT Plus, Pro и Team, и планируется расширение доступа в ближайшем будущем.

 

Источник: iXBT

Читайте также