Google выпустила новый ИИ Gemini 2.5 Flash, но он оказался слабее предшественника и не прошел тесты безопасности

Недавно представленная модель искусственного интеллекта Google Gemini 2.5 Flash показала худшие показатели в ряде тестов на безопасность по сравнению с предыдущей версией.

В опубликованном на этой неделе техническом отчете Google признала, что модель Gemini 2.5 Flash с большей вероятностью может генерировать текст, который нарушает стандарты безопасности, чем Gemini 2.0 Flash. По двум параметрам, «безопасность текст-текст» и «безопасность изображение-текст», Gemini 2.5 Flash продемонстрировала снижение на 4,1% и 9,6% соответственно.

Первый показатель определяет частоту нарушений правил Google при текстовых подсказках, в то время как второй оценивает точность соблюдения этих границ при предоставлении подсказки через изображение. Оба тестирования автоматизированы и выполняются без участия человека.


Google выпустила новый ИИ Gemini 2.5 Flash, но он оказался слабее предшественника и не прошел тесты безопасности
Иллюстрация: Qwen

Представитель Google подтвердил, что Gemini 2.5 Flash «имеет худшие показатели в тестах безопасности текстуальных и визуальных преобразований».

Согласно техническому отчету Google, несмотря на то, что Gemini 2.5 Flash находится в предварительной стадии, она лучше следует инструкциями по сравнению с Gemini 2.0 Flash, включая пересечение проблемных границ. Компания отмечает, что некоторые негативные результаты связаны с ложными срабатываниями, но также признает, что Gemini 2.5 Flash иногда генерирует «неприемлемый контент» по прямому запросу.

 

Источник: iXBT

Читайте также