Amazon atribuye la caída global de su nube a un fallo en su software de automatización DNS
En una publicación en su sitio web, AWS detalló que el incidente fue provocado por un fallo en su sistema automatizado de gestión de DNS, que borró los registros necesarios para que sus servicios se conectaran correctamente.

Amazon Web Services (AWS) ha explicado las causas de la caída masiva de su servicio de almacenamiento en la nube ocurrida esta semana, la cual dejó fuera de servicio durante más de 14 horas a numerosas plataformas y servicios en todo el mundo.
El problema se originó cuando varios clientes, incluyendo empresas como Signal, no pudieron acceder a DynamoDB, el sistema que almacena datos de sus usuarios. La compañía indicó que el fallo se debió a un «defecto latente» en su automatización, que en lugar de corregirse automáticamente, requirió intervención manual del personal técnico para su resolución. Como resultado, servidores y aplicaciones clave en regiones como Virginia del Norte quedaron afectados, impactando a más de 8 millones de usuarios y a alrededor de 2.000 sitios, entre ellos plataformas de banca en línea, sitios gubernamentales, redes sociales y servicios de comida a domicilio.
Expertos en tecnología han señalado que este incidente evidencia la alta dependencia de Europa y del mundo en un único proveedor de servicios en la nube, resaltando la necesidad de diversificación y mayor resiliencia en infraestructuras digitales.
Aunque AWS logró solucionar el problema en horas, el impacto y las interrupciones se sintieron durante más de medio día, dejando en evidencia las vulnerabilidades del sistema y la importancia de robustecer los mecanismos de recuperación ante fallos automatizados.
