Если ваш компьютер внезапно завис, выдал «синий экран смерти» или не смог скопировать файл — не спешите обвинять производителя компьютерной техники или глючной памяти. Возможно, причина сбоя — космическая радиация. Такие события называются «нарушением в результате единичного события» (single-event upset, SEU).
Нарушение в результате единичного события — это изменение состояния электронного компонента, вызванное одной частицей ионизирующего излучения (ион, фотон, протон, нейтрон и т.д.), которая сталкивается с чувствительным узлом системы, таким как микропроцессор, полупроводниковая память или мощный транзистор. Изменение состояния происходит из-за возникновения свободного заряда, который появляется в результате ионизации внутри или рядом с чувствительным узлом системы или логическим элементом, таким как бит памяти. В итоге устройство выдаёт ошибку. Эту единичную ошибку и называют «нарушением в результате единичного события», SEU или просто случайным сбоем (soft error).
Случайные сбои из-за космической радиации действительно периодически происходят даже на земле, а вероятность их появления в самолётах на высоте и на околоземной орбите в сотни раз больше. Чем выше — тем более вероятно, потому что там слабее защита магнитным полем Земли от космической радиации.
Последствия SEU могут быть разными. Например, в цифровой фотографии может выпасть один пиксель. Ничего страшного. Другое дело, если из-за космического нейтрона глючит компьютерная система самолёта — и ему приходится идти на вынужденную посадку. Такое действительно однажды случилось с военно-транспортным самолётом C-141B Starlifter, который испытал случайный сбой во время полёта над Японским морем с более чем 100 пассажирами на борту. Во время полёта самолёт внезапно свалился на правое крыло. Экипажу удалось выправить крен и посадить самолёт. Последующее расследование показало, что микрочип в системе автоматического управления внезапно выдал ложные показания с неверным битом — вероятно, из-за столкновения с нейтроном.
По статистике, на большой высоте через каждый квадратный метр поверхности проходит примерно 1600 космических частиц в секунду. То есть через каждый квадратный сантиметр проходит примерно 600 космические частицы в час. Исходя из таких предпосылок, случайные сбои могут быть совсем не такими редкими событиями, как кому-то кажется.
На высоте более 9000 метров интенсивность нейтронного потока в 300 раз выше, чем на уровне моря. Настолько же возрастает вероятность нарушения в результате единичного события. К сожалению, не существует никакой реальной защиты от космических лучей, так что остаётся лишь полагаться на везение.
7 октября 2008 года авиалайнер Airbus A330-303 компании Qantas Airways шёл по маршруту из Перта (Австралия) в Сингапур. На высоте 11 300 метров произошёл сбой в одном из трёх опорных инерциальных блоков, в результате чего в компьютерную систему управления были отправлены некорректные данные. По этой причине самолёт резко ушёл вниз, подкинув вверх пассажиров, которые не были пристёгнуты ремнями безопасности. Травмы получили 110 из 303 пассажиров, а также 9 из 12 членов экипажа. Среди пассажиров 12 человек получили серьёзные травмы, а ещё 39 человек обратились в больницу. Среди всех возможных причин сбоя инерциального блока осталась неисключённой только SEU, остальные признаны «маловероятными» или «очень маловероятными». Однако Австралийский совет по безопасности транспорта посчитал «недостаточными свидетельства для оценки вероятности», что именно SEU стала причиной сбоя.
Хотя на Земле вероятность единичного сбоя из-за космического излучения в 300 раз ниже, чем на высоте 9000 метров, но иногда этому явлению приписывают самые необъяснимые события, которые происходят с компьютерной техникой. Например, в 2003 году машина для электронного голосования в городе Схарбек (Бельгия) добавила 4096 голосов одному из кандидатов на выборах. Расследование показало, что этот сбой был вызван изменением одного бита в памяти устройства. Причиной назвали космическое излучение. Что характерно, ошибку обнаружили только благодаря тому, что кандидат получил больше голосов, чем было возможно. Иначе бы сбой остался незамеченным.
«Это действительно большая проблема, но она в значительной степени остаётся незаметной для общества», — говорит Бхарат Б’ува (Bharat Bhuva), член научно-исследовательской группы по изучению эффектов радиации (Radiation Effects Research Group) и профессор электротехники в Университете Вандербильта (США). Эта исследовательская группа была образована в 1987 году в том числе для изучения влияния космического излучения на электронные системы. Первоначально группа занималась военными и космическими системами, но с 2001 года расширила сферу интересов и на бытовую электронику.
Хотя существуют довольно яркие примеры сбоев техники, SEU остаются исключительно редким феноменом. Но специалисты обращают внимание, что электронные микросхемы всё чаще используются в различных бытовых приборах. Плотность транзисторов на чипах возрастает, как и их количество. Из-за этого вероятность встречи с «космическим сбоем» растёт с каждым годом. Производители электротехники изучают проблему. Например, в 2008 году инженеры компании Fujitsu забрались на гавайский вулкан, чтобы измерить космическое излучение на высоте 4200 метров. Там оно примерно в 16 раз выше, чем на уровне моря.
Для защиты от космического излучения производители бытовой электроники пытаются использовать менее чувствительные материалы и коды исправления ошибок (error-correction codes). В более дорогих устройствах можно применять системы дублирования.
У инженеров, системных администраторов и программистов теперь есть отличная «отмазка», чтобы объяснить странные глюки компьютерной техники.
Источник