В Манчестерском университете случился непредвиденный инцидент с нейроморфным суперкомпьютером SpiNNaker, который привел к частичным повреждениям системы. Профессор Стив Фербер, один из разработчиков проекта, сообщил, что причиной стал сбой в системе охлаждения в пасхальные выходные 20–21 апреля. «Это досадное происшествие, но SpiNNaker по-прежнему остается моим детищем», — подчеркнул Фербер, хотя уже вышел на пенсию.
Сбой произошел из-за прекращения подачи охлажденной воды в систему охлаждения серверных шкафов. Вместо отвода тепла система начала его накапливать, что вызвало резкий подъем температуры. Хотя нейроморфные чипы SpiNNaker автоматически отключались при перегреве, сетевые коммутаторы и блоки питания продолжали функционировать, что привело к их повреждению. По словам Фербера, это усложняет диагностику: без исправных компонентов невозможно проверить все 80 тысяч плат системы.

Инфраструктурные проблемы усложнились из-за длительных выходных — реакция на ситуацию была медленнее, чем могла бы быть. Примечательно, что за девять лет эксплуатации SpiNNaker в здании Килберна, построенном в 1972 году, подобные сбои уже случались, но не приводили к серьезным последствиям. Сейчас система восстановлена на 80% и проходит проверку. Однако замена поврежденных компонентов может вызвать новые задержки.
Ключевой сильной стороной SpiNNaker остается его устойчивая архитектура: программное обеспечение может адаптироваться к частичным поломкам. Команда разработчиков работает над автоматизацией экстренного отключения всей системы при перегреве, чтобы предотвратить повторение ситуации.
SpiNNaker, предназначенный для моделирования нейронных сетей мозга с помощью миллиона ARM-ядер, продолжает участие в масштабных проектах, включая моделирование работы мозга мыши. Этот инцидент подчеркнул риски применения нестандартных решений для охлаждения в высокопроизводительных системах. Как отметил Фербер, опыт устранения последствий перегрева важен для прогресса нейроморфных технологий и управления сложными вычислительными кластерами.
Источник: iXBT



