Российские усилия по разработке национального стандарта для синтеза данных как шаг вперёд в развитии искусственного интеллекта

На платформе Ассоциации больших данных, в сотрудничестве с Сбером и другими членами организации, был разработан начальный проект национального стандарта для генерации данных. По информации, предоставленной пресс-службой Сбера, данный стандарт направлен на улучшение доступности, безопасности и качества данных, что важно для развития искусственного интеллекта в России.


Российские усилия по разработке национального стандарта для синтеза данных как шаг вперёд в развитии искусственного интеллекта
Сгенерировано нейросетью Dall-E

Согласно объяснениям Сбера:

Ключевая задача стандарта заключается в описании метода создания конфиденциальных синтетических данных, необходимых для развития AI-технологий. Важность охраны приватности должна соблюдаться на всех этапах синтетического процесса, который основан на принципах дифференциальной приватности.

Документ включает в себя математические обоснования, доказывающие, что при соблюдении стандартных рекомендаций возможно синтезировать данные без угрозы для конфиденциальности. Защита достигается путем оптимального соотношения между уровнем приватности и качеством создаваемых наборов данных (датасетов).

Президент Ассоциации больших данных, Анна Серебряникова, отметила:

Введение национального стандарта на синтез данных обеспечит прозрачность процессов генерации, надежность технологической структуры и выработку критериев для оценки качества данных. Синтетические данные могут стать полноценной альтернативой обезличенным данным, которые часто сталкиваются с чрезмерными нормативными ограничениями. Успешное следование требованиям приватности позволяет избежать инцидентов утечек, создавая новые возможности для доступа к данным, необходимым для обучения искусственного интеллекта. Мы рассчитываем, что после внедрения этого национального стандарта синтетические данные получат широкое распространение в России.

Планируется, что в 2025 году проект предварительного национального стандарта будет утвержден в Техническом комитете по стандартизации «Искусственный интеллект» (ТК 164).

 

Источник: iXBT

Читайте также