В течение нескольких часов сегодня во многих уголках мира зафиксировали значительные сбои в работе многочисленных ресурсов. Виной всему оказалась компания Cloudflare, которая теперь прояснила причины произошедшего.
Выяснилось, что никаких внешних атак или аварий не было: причиной стали изменения в конфигурации, запланированные заранее. Об этом сообщил технический директор компании Дейн Кнехт.

Не стану скрывать: сегодня утром мы подвели наших клиентов и всю сеть, когда внутренняя неполадка в инфраструктуре Cloudflare затронула огромный объём трафика, зависящий от наших сервисов.
Ресурсы компаний и организаций, опирающиеся на Cloudflare, ощутили последствия нашего сбоя, и я глубоко извиняюсь за причинённые неудобства.
Мы придаём большое значение прозрачности и в ближайшие часы опубликуем полную техническую сводку. Кратко говоря, скрытый дефект в модуле, обеспечивающем нашу антибот-защиту, активировался после планового обновления конфигурации. Это вызвало масштабное ухудшение работы нашей сети и сопутствующих сервисов. Это не был злонамеренный инцидент. Сама проблема, её масштаб и время устранения недопустимы. Мы уже внедряем меры, чтобы исключить повторение, но признаём, что сегодня ситуация вышла из-под контроля. Доверие клиентов — наш главный приоритет, и мы приложим все усилия для его восстановления.
Сбой продолжался примерно три часа, после чего специалисты компании выявили причину и приступили к поэтапному восстановлению работы сервисов.
Отметим, что это уже третий масштабный инцидент за последний месяц. В октябре из-за сбоя DNS более двух часов была недоступна большая часть региона US-East-1 в AWS, а несколькими днями позже произошёл крупный сбой Microsoft Azure. Всё это ощущают многие пользователи Интернета: на Cloudflare приходится около 19 % трафика, тогда как доли Azure и AWS составляют приблизительно 24 % и 30 % облачного рынка соответственно.
Источник: iXBT



