Ассоциация продуктов для камер и изображений CIPA (с англ. Camera & Imaging Products Association) анонсировала новую версию стандарта EXIF 3.0.
EXIF (англ. Exchangeable Image File Format ) позволяет добавлять к изображениям дополнительную информацию или метаданные, описывающие условия и способы создания изображения, авторство, геолокацию, дату и время съемки и т. п. В большинстве своем EXIF предоставляют набор метаданных с упором на данные, передаваемые с камеры. Информация, записанная по этому стандарту, может использоваться как пользователем, так и различными устройствами, например, операционными системами и система управления файлов. Стандарт разрабатывается японской ассоциацией CIPA, которая существует более 20 лет занимается техническими вопросами фотографии. Постоянными членами ассоциации являются Canon, Apple, Nikon, Fujifilm, Sony, Panasonic и другие крупные бренды.
Первая версия стандарта Exif была выпущена в 1995 году, а предыдущий релиз 2.32 — в 2019 году. В новую версию внесены серьезные изменения, поэтому создатели сочли необходимым увеличить основной номер версии — 3.0.
Этим выпуском Ассоциация разрешила такие вопросы:
- мультиязычные текстовые свойства стандарта
- уникальные идентификаторы изображения
- в каких случаях значения свойств exif могут быть изменены или удалены
Об этих вопросах и рекомендациях по синхронизации разных стандартов поговорим в этой статье.
Почему мы считаем это важным?
Меня зовут Сергей Фомин, я профессиональный фотограф (посмотрите мой авторский проект “Полет над Россией”), генеральный директор экосистемы продуктов Picvario, которая работает с большим объемом изображений: мы более 20 лет предлагаем услуги фото- информационного агентства и стокового ресурса, а с 2019 года занимаемся разработкой системы управления контентом DAM Picvario.
Пользователями и потребителями метаданных являются миллионы человек, иногда даже не осознавая это. Самый простой пример — поисковые системы, которые “считывают” метаданные изображений и формируют вашу поисковую выдачу.
Что касается профессиональной практики, то заполнение метаданных изображений — это обязательное требование для создателей контента, которые хотят распространять свои фотографии на известных стоках. Без них фотографии попросту не пройдут модерацию и не будут опубликованы.
Почему площадки так требовательны? Причина проста — потребители контента не смогут найти нужный файл без метаданных. СМИ, дизайнеры, маркетологи и др. используют для поиска текстовые запросы, при этом поиск осуществляется как раз по соответствию запроса метаданным международных стандартов — Exif, IPTC, xmp. Важность метаданных сложно описать в одном абзаце: ранее мы писали лонгрид, заходите узнать подробнее.
Итак, что изменилось в новом выпуске Exif 3.0
1. Мультиязычные текстовые свойства стандарта
Проблема: Текстовые поля, такие как «Авторское право» и «Исполнитель», по требованиям стандарта должны были быть в формате ASCII. Из-за этого возникала проблема с текстовыми полями. Если их заполняли не на английском языке, данные не читались при передаче с устройства на устройство.
На практике это означало, что:
● пользователи были вынуждены заполнять поля либо только на английском, либо оставлять поля пустыми
● некоторые программные пакеты игнорировали стандарт и использовали другие наборы символов, нарушая спецификацию.
Решение: В Exif 3.0 представлен новый тип данных «UTF-8», который позволяет поддерживать мультиязычные наборы символов, от русского и греческого до китайского и арабского.
2. Уникальные идентификаторы
Проблема: Свойство стандарта ImageUniqueID было неточным: не были описаны требования к размерности поля. Из-за этого у ПО возникали проблемы с обработкой — чтением и записью свойства. (прим. ImageUniqueID — уникальный идентификатор стандарта EXIF, который устанавливается камерой во время съемки).
Решение: Предложен алгоритм обработки свойства:
- Поле должно быть записано как строка ASCII в шестнадцатеричной системе счисления, эквивалентная 128-битному UUID фиксированной длины в соответствии с ISO/IEC 9834-8. (прим. ASCII — название кодировки, набора, в которой некоторым распространённым печатным и непечатным символам сопоставлены числовые коды).
- Универсальный уникальный идентификатор или UUID должен быть версии 1 или версии 4, при этом рекомендуется использовать UUID версии 4. Этот идентификатор присваивается в момент съемки изображения, и записанный идентификатор не обновляется и не стирается при последующем редактировании.
3. Когда и как значения свойств exif могут быть изменены или удалены
Проблема: В метаданных EXIF автоматически с камеры записывается конфиденциальная информация, например, данные GPS. Чтобы избежать рисков публичного размещения конфиденциальных данных, особенно это касается при съемке с камер смартфонов, пользователи удаляют ВСЮ информацию из метаданных EXIF. Из-за этого программное обеспечение не может осуществлять постобработку изображения. Одной из причин такой потери информации было то, что спецификацией предыдущей версии стандарта не было регламентировано, какие свойства важны для постобработки, а какие могут быть отредактированы или удалены.
Решение: Новый релиз Exif 3.0 добавляет новое Приложение H. «Руководство по обработке информации свойств при постобработке прикладным программным обеспечением», в котором метаданные группируются по:
● категориям: метаданные, связанные со структурой изображения; метаданные, связанные с условиями съемки; и метаданные, содержащие другую информацию.
● по рангу в зависимости от того, когда они должны быть изменены или удалены, если вообще должны.
Новую спецификацию «CIPA DC-008-Translation-2023 Сменный формат файла изображения для цифровых фотоаппаратов: версия Exif 3.0» можно загрузить с сайта https://www.cipa.jp/std/documents/download_e.html?DC- 008-Перевод-2023-E .
Полный список изменений в Exif 3.0 читайте по ссылке на сайте https://iptc.org/news/exif-3-0-released-featuring-utf-8-support/
Синхронизация свойств из разных стандартов
Как мы упоминали выше, существуют несколько международных стандартов изображений: самые распространенные Exif, IPTC/xmp. Последние два, в отличии от exif с техническими данными о фотографии, представляют описательную информацию: кто и что изображено на фотографии, имя модели и разрешения на распространение файлов, инструкции по использованию и лицензированию и т.д..
Однако, назначение некоторых свойств разных стандартов одинаковое. Для сохранения данных, избежания перезаписи и/или дублирования информации разработчиками стандартов было создано Руководство по синхронизации, которое определяет, какие именно свойства должны быть согласованы.
Руководство поясняет, как синхронизировать четыре словаря метаданных:
● Метаданные IPTC Photo, в том числе модель обмена информацией IPTC-II.
● Метаданные стандарта XMP (adobe.
● Метаданные стандарта Exi.
● Словарь Schema.org, который предоставляет набор свойств метаданных для структурирования данных в Интернете. Схемы представляют собой теги HTML-кода, в которые интегрируются метаданные.
Заключение
Несмотря на то, что меняется стандарт EXIF, новый релиз затрагивает и другие международные стандарты, в частности IPTC/xmp. Picvario, как представитель IPTC сообщества, в настоящее время работает над согласованием полей синхронизации стандарта. Проект Руководства по сопоставлению полей стандартов и инструкция к нему по ссылке https://docs.google.com/document/d/1HLZtublVflXM4x5hj8LsX8WjjOQqvLAZZXfM7cj0kJA/edit?usp=sharing
Крупные бренды-производители техники понимают, как важно научить разное ПО “говорить на одном языке”, поэтому мы как разработчики системы для управления контентом постоянно следим за рекомендациями международных ассоциаций.
В то время как гайдлайны стандартов метаданных носят рекомендательный характер, на практике это must have для всех, вовлеченных в работу с медиа — фотографов, дизайнеров, СМИ, и, разумеется, разработчиков ПО, таких как наша компания Picvario.