banner
Hogar / Blog / Gremlin ahora puede encontrar automáticamente problemas de confiabilidad comunes
Blog

Gremlin ahora puede encontrar automáticamente problemas de confiabilidad comunes

Apr 25, 2024Apr 25, 2024

Gremlin, la startup de pruebas de confiabilidad mejor conocida por sus herramientas de ingeniería del caos, anunció hoy el lanzamiento de su función Riesgos detectados. Con esto, Gremlin ahora puede identificar automáticamente problemas de confiabilidad de alta prioridad, como una mala configuración o valores predeterminados incorrectos en los servicios basados ​​en Kubernetes y luego categorizarlos según la gravedad del riesgo que presentan. El servicio también sugerirá posibles soluciones.

"La confiabilidad sigue ganando importancia", dijo Kolton Andrus, director de tecnología y fundador de Gremlin. “Nuestra infraestructura digital es tan importante como nuestra infraestructura física. El gobierno, la atención médica, el transporte, las comunicaciones y las finanzas dependen de esta base digital, y esto conlleva riesgos. Afortunadamente, muchos de estos riesgos son fáciles de mitigar, si se conocen. Es por eso que nos complace anunciar nuestros nuevos Riesgos Detectados. Hemos trabajado arduamente para exponer rápidamente problemas graves dentro de los sistemas de nuestros clientes, riesgos que luego pueden mitigar para mejorar cualitativamente la situación de sus sistemas”.

Créditos de imagen:Duendecillo

Mientras que las herramientas de ingeniería del caos de Gremlin buscan situaciones inusuales que pueden llevar la infraestructura de una empresa al límite, Detected Risks utiliza un conjunto de pruebas preconfiguradas, y 20 más se lanzarán a finales de este año. Estas pruebas buscan problemas comunes que puedan afectar la confiabilidad y resistencia de la infraestructura de una empresa. Riesgos detectados funciona sin tener que ejecutar experimentos de ingeniería del caos o pruebas de confiabilidad.

En gran medida, estas pruebas son bastante sencillas y resumen las mejores prácticas, como garantizar que una implementación esté configurada para ejecutarse en múltiples zonas de disponibilidad para garantizar la redundancia. Puede parecer de sentido común, pero al observar las miles de implementaciones que ejecutan sus clientes, Gremlin descubrió que el 26 % no tenía redundancia y el 80 % de las implementaciones no tenían dos redundancias. La compañía señala que el sistema también busca configuraciones erróneas comunes de Kubernetes que podrían afectar el escalado automático, por ejemplo.

"Nuestra industria tiene muchas SRE brillantes que trabajan arduamente para mitigar personalmente estos problemas, pero ese enfoque no escala", dijo Andrus. “Estamos resolviendo este problema creando algo fácil de usar que proporciona información valiosa sobre miles de aplicaciones del mundo real. Proporcionar liderazgo en ingeniería con visibilidad de los riesgos existentes les ayuda a priorizar y realizar este importante trabajo para que puedan continuar protegiendo la experiencia del cliente y creando software de alta calidad”.

Créditos de imagen: