Saltar al contenido principal

Agente de DevOps de AWS

Impulse la excelencia operativa con un agente de IA autónomo que resuelve y previene incidentes de forma proactiva

¿Por qué elegir Agente de DevOps de AWS?

Agente de DevOps de AWS ya se encuentra disponible de forma general y es su compañero de equipo de operaciones siempre disponible para resolver y prevenir los incidentes de manera proactiva, optimizar la fiabilidad y el rendimiento de las aplicaciones, y gestionar las tareas de SRE bajo demanda en entornos de AWS, multinube y en las instalaciones. Investiga incidentes e identifica mejoras operativas como lo haría un ingeniero de DevOps experimentado: aprendiendo sobre sus aplicaciones y sus relaciones, trabajando con sus herramientas de observabilidad, runbooks, repositorios de código y canalizaciones de CI/CD, y correlacionando datos de telemetría, código e implementaciones en todos los entornos. Haga preguntas, obtenga respuestas contextuales al instante y cree gráficos e informes personalizados que puede guardar y compartir con su equipo.

Beneficios

    AWS DevOps Agent es su ingeniero de guardia autónomo y siempre disponible. Comienza a investigar el momento en que llega una alerta, ya sean las 2 de la madrugada o durante las horas pico, con el objetivo de que su aplicación vuelva a tener un rendimiento óptimo. AWS DevOps Agent evalúa los incidentes de forma autónoma de manera ininterrumpida y proporciona un análisis de la causa raíz y acciones para su resolución. Utiliza su comprensión de los recursos y las relaciones de las aplicaciones para comprender con rapidez las dependencias y las interacciones. AWS DevOps Agent agiliza la respuesta ante incidentes al dirigir de manera automática las observaciones, los resultados y los pasos de mitigación a través de sus canales de comunicación preferidos, como Slack, ServiceNow y PagerDuty.

    Agente de DevOps de AWS analiza los patrones de los incidentes históricos para ofrecer recomendaciones prácticas que refuerzan cuatro áreas clave: la observabilidad, la optimización de la infraestructura, la mejora de las canalizaciones de implementación y la resiliencia de las aplicaciones. Las recomendaciones incluyen especificaciones listas para usar por agentes, con el fin de delegar la implementación a su agente de codificación o a un compañero para actualizar el código de la aplicación o la infraestructura. Esto impulsa la mejora continua sin necesidad de gestionar el trabajo acumulado.

    Agente de DevOps de AWS le permite acceder a la información sin aprovechar de sus datos operativos mediante la integración segura con sus flujos de trabajo y herramientas de observabilidad, manuales de procedimientos, repositorios de código y canalizaciones de CI/CD. Agente de DevOps de AWS ofrece integraciones integradas con herramientas de observabilidad como Amazon CloudWatch, Dynatrace, Datadog, Grafana, New Relic y Splunk, y con repositorios de código y canalizaciones de CI/CD como Azure DevOps, GitHub y GitLab. Puede ampliar Agente de DevOps de AWS más allá de sus integraciones integradas conectándose de forma segura a sus servidores MCP privados o remotos, lo que permite integraciones con herramientas adicionales como las herramientas personalizadas de su organización, plataformas especializadas o sistemas de tickets propietarios.

    Agente de DevOps de AWS aprovecha su profundo conocimiento de su entorno, lo que le permite profundizar en el entorno de su aplicación; más allá de hacer preguntas, puede crear, guardar y compartir gráficos e informes personalizados. Consulte el estado de los recursos, investigue patrones de incidentes, realice un seguimiento de las implementaciones y explore recomendaciones de prevención, todo a través de una interfaz de lenguaje natural. Cree, guarde y comparta gráficos e informes personalizados que le permitan realizar un seguimiento de las métricas operativas y a comunicar información a su equipo.

Clientes

United Airlines

“En United Airlines, transportamos a más de 500 000 pasajeros al día. Contamos con cerca de 38 000 agentes de Dynatrace OneAgent que supervisan un entorno de nube híbrida, más de 500 cuentas de AWS, 20 000 funciones de AWS Lambda, microservicios de Amazon ECS y muchos otros servicios. A esta escala, usábamos antes múltiples herramientas que realizaban las mismas funciones en diferentes dominios, lo que generaba brechas y cajas negras durante la solución de problemas. Agente de DevOps de AWS con Dynatrace cambia eso por completo. Dynatrace detecta los problemas de forma rápida y precisa, identifica la capa de aplicación responsable y, a continuación, el agente investiga más a fondo y proporciona pasos precisos para resolver el problema, todo directamente integrado en Dynatrace. En lugar de iniciar una llamada de incidentes a las 3 de la madrugada y cambiar entre herramientas, ahora tenemos las respuestas listas: un único panel de control”.

Jason Eckhart, ingeniero principal de confiabilidad y observabilidad de United Airlines

Missing alt text value

T-Mobile

“Cuando AWS presentó Agente de DevOps, T-Mobile estuvo presente desde el primer día. Como socio de diseño, vimos cómo Agente de DevOps de AWS puede mejorar significativamente el análisis de causa raíz en entornos de producción. Nuestros comentarios del mundo real influyeron directamente en la evolución del producto. 

Nuestra infraestructura abarca múltiples nubes y entornos en las instalaciones, con registros de aplicaciones centralizados en nuestra implementación de Splunk en las instalaciones. La capacidad de Agente de DevOps de AWS para integrarse fluidamente con Splunk y analizar registros en estos diversos entornos resultó ser muy valiosa a medida que continuamos con la fase piloto de la solución”.

Aravind Manchireddy, vicepresidente sénior de operaciones tecnológicas de T-Mobile

Missing alt text value

Western Governors University

Western Governors University (WGU), una destacada universidad por Internet que cuenta con más de 191 000 estudiantes, fue una de las primeras organizaciones en implementar Agente de DevOps de Amazon en producción, incluso antes del lanzamiento de la versión preliminar en re:Invent. Como usuario a gran escala de Dynatrace, WGU aprovecha la integración nativa de Dynatrace en el Agente de DevOps, lo que permite que Dynatrace Intelligence enrute automáticamente los registros de problemas al agente para su investigación y devuelva los resultados enriquecidos directamente a Dynatrace.

Durante una investigación de producción reciente, el equipo de SRE de WGU usó Agente de DevOps para analizar un escenario de interrupción del servicio, lo que redujo el tiempo total de resolución de 2 horas estimadas a solo 28 minutos, una mejora del 77 % en el MTTR. El agente identificó rápidamente la causa raíz en la configuración de una función de Lambda, descubriendo información operativa crítica que antes solo existía en documentación interna sin catalogar.

“Fue capaz de proporcionar la clave del caso e identificó que Lambda era la causa. La investigación tenía métricas casi perfectas que coincidían con lo que veíamos en el front-end”. Y agregó: “Ayer fue una gran victoria; si podemos seguir acelerando el proceso de descubrimiento, no puedo describir lo que eso significaría para nuestra organización”. Con planes de aprovechar la característica Habilidades de Agente de DevOps, WGU está en camino de reducir aún más el tiempo de investigación.

Angel Marchena, director de operaciones técnicas de Western Governors University

Missing alt text value

Zenchef

Zenchef es una plataforma tecnológica para restaurantes que ayuda a gestionar reservas, operaciones de mesa, menús digitales, pagos y marketing de clientes desde un único sistema sin comisiones. Con un equipo de DevOps reducido que gestiona varios entornos de producción en múltiples unidades de negocio, se enfrentaron a una prueba real cuando un problema de integración de API que afectaba a un socio externo surgió durante un hackathon de la empresa, con los ingenieros participando en el evento y sin que la supervisión mostrara nada significativo que los orientara.

En lugar de apartar a los ingenieros del hackathon, el equipo llevó el problema a Agente de DevOps. Este abordó el problema de forma sistemática, descartó la autenticación como factor contribuyente, trasladó el foco de la investigación a las implementaciones de ECS y, en última instancia, rastreó la causa raíz hasta una regresión de código en la que una nueva versión no pudo gestionar un valor de enumeración no reconocido en la base de datos. La investigación completa se resolvió en 20-30 minutos, aproximadamente un 75 % menos que las 1-2 horas que hubiera llevado de forma manual, y los resultados se compartieron directamente con el ingeniero responsable.

“Durante el hackathon, no teníamos casi nada de ancho de banda para investigar, y no lo necesitamos. Siempre intentamos ir unos pasos por delante, y este tipo de investigación proactiva no siempre es posible de otro modo. Agente de DevOps está habilitando nuevas formas de entender cómo se comportan nuestras plataformas”.

Theo Massard, gerente de ingeniería de plataformas de Zenchef

Missing alt text value

Casos de uso

Respuesta y resolución de incidentes

AWS DevOps Agent clasifica los incidentes de forma autónoma y guía a los equipos para que los resuelvan con rapidez. AWS DevOps Agent se integra con herramientas de observabilidad, repositorios de código y canalizaciones de CI/CD para correlacionar y analizar los datos de telemetría, código e implementación, y compartir sus hipótesis, observaciones y resultados. Mediante las investigaciones sistemáticas, AWS DevOps Agent identifica la causa raíz de los problemas derivados de cambios en el sistema, anomalías de entrada, límites de recursos, errores de componentes y problemas de dependencias en todo el entorno.

Coordinación de incidentes automatizada

Puede iniciar y guiar las investigaciones mediante un chat interactivo. AWS DevOps Agent actúa como miembro de su equipo de operaciones y trabaja directamente en sus herramientas de colaboración, como ServiceNow y Slack, para compartir los resultados y coordinar la respuesta. Cuando sea necesario, cree un caso de AWS Support directamente a partir de una investigación para ofrecer a los expertos de AWS Support contexto inmediato a fin de que conseguir una resolución más rápida.

Prevenga futuros incidentes operativos

AWS DevOps Agent analiza los patrones de los incidentes históricos para ofrecer recomendaciones prácticas que refuerzan cuatro áreas clave: la observabilidad, la optimización de la infraestructura, la mejora de las canalizaciones de implementación y la resiliencia de las aplicaciones. 

Acelere la gestión de tareas de SRE bajo demanda

Obtenga respuestas contextuales inmediatas a preguntas operativas sin tener que navegar entre consolas. Consulte el estado de los recursos, investigue patrones de incidentes, realice un seguimiento de las implementaciones y explore recomendaciones mediante conversación natural. Más allá del formato de preguntas y respuestas, cree, guarde y comparta gráficos e informes personalizados, como resúmenes diarios del estado de las operaciones o tendencias de errores 4xx. El historial de conversaciones se conserva para que pueda retomar consultas anteriores sin perder el contexto.

¿Ha encontrado lo que buscaba hoy?

Ayúdenos a mejorar la calidad del contenido de nuestras páginas compartiendo sus comentarios