Amazon подробно описал причины массового сбоя в работе сервисов AWS, который затронул приложения от банков до умных кроватей. Ошибка в системе автоматизации управления DNS для DynamoDB создала пустую запись DNS для дата-центра в Вирджинии, вызвав цепь ошибок. Этот сбой помешал автоматизации исправить себя, потребовав вмешательства инженеров.
После инцидента AWS временно отключил системы автоматизации DNS, чтобы предотвратить другие проблемы. Во время сбоя такие платформы, как Signal, Snapchat и банковские сайты, были затронуты, что привело к более чем 8,1 миллиона отчетов о проблемах. Эксперты подчеркивают уязвимость современного интернета, указывая на зависимость от нескольких крупных облачных провайдеров, что создает уникальные точки отказа.