Amazon a détaillé les causes de l'interruption massive des services AWS, qui a affecté des applications allant des banques aux lits intelligents. Un défaut dans le système d'automatisation de la gestion DNS pour DynamoDB a créé un enregistrement DNS vide pour le centre de données en Virginie, provoquant une série d'erreurs en chaîne. Ce défaut a empêché l'automatisation de se réparer elle-même, nécessitant l'intervention des ingénieurs.
À la suite de l'incident, AWS a désactivé temporairement les systèmes d'automatisation DNS pour prévenir d'autres problèmes. Pendant l'interruption, des plateformes telles que Signal, Snapchat et des sites bancaires ont été affectés, générant plus de 8,1 millions de rapports de problèmes. Les experts soulignent la vulnérabilité de l'internet moderne, mettant en évidence la dépendance à quelques grands fournisseurs de cloud, ce qui crée des points uniques de défaillance.