




Resumen: Buscamos un SRE Senior de Plataforma para garantizar la fiabilidad y la mejora continua de las plataformas empresariales mediante operaciones impulsadas por ingeniería, automatización y liderazgo en la gestión de incidentes. Aspectos destacados: 1. Garantizar la fiabilidad y la mejora continua de las plataformas empresariales 2. Liderar operaciones impulsadas por ingeniería, centrándose en la automatización y la infraestructura como código (IaC) 3. Impulsar la gestión de problemas, el análisis de causa raíz (RCA) y las acciones preventivas para los incidentes SRE Senior de Plataforma (Operaciones de Plataforma) Propósito del puesto: * Garantizar la fiabilidad, operabilidad y mejora continua de las plataformas empresariales de TD SYNNEX en entornos híbridos en la nube y locales. * Operaciones impulsadas por ingeniería, centradas en la automatización, la infraestructura como código (IaC), la observabilidad y la reducción de tareas repetitivas (toil). * Actuar como nivel 3 (L3) de escalación para incidentes complejos; mejorar continuamente la postura operativa de la plataforma y su preparación para la ejecución por los niveles 1 y 2 (L1/L2). Responsabilidades principales: * Fiabilidad de la plataforma (nube híbrida \+ local): Asumir la responsabilidad de la postura de fiabilidad a nivel L3; definir indicadores de nivel de servicio (SLO) y KPI; liderar puertas de operabilidad y preparación para producción; mantener manuales de procedimientos (runbooks) y procedimientos operativos estándar (SOP). * Automatización \& IaC: Diseñar y construir automatización operativa (comprobaciones de estado, flujos de corrección); desarrollar configuraciones con Terraform y Ansible; escribir scripts en Python (preferido), PowerShell y/o Bash; integrar con sistemas de gestión de servicios de TI (ITSM) para autogestión auditada y correcciones controladas. * Gestión de incidentes/problemas/RCA (nivel L3\): Liderar el diagnóstico, estabilización y recuperación de incidentes importantes; impulsar la gestión de problemas, el análisis de causa raíz (RCA) y las acciones preventivas; reducir el tiempo medio de resolución (MTTR) y el tiempo medio de detección (MTTD) mediante mejores señales, manuales de procedimientos y automatización. * Normas de observabilidad: Definir señales accionables, calidad de alertas, paneles de control y registros; ajustar los sistemas de alerta para reducir el ruido; realizar revisiones operativas basadas en datos. * Habilitación de AIOps: Avanzar hacia operaciones predictivas y proactivas (detección de anomalías, análisis de tendencias y capacidad); apoyar análisis basados en Python y modelos de aprendizaje automático (ML)/aprendizaje profundo (DL) cuando sea aplicable; industrializar la inteligencia operativa de forma segura. * Habilitación de proveedores (niveles L1/L2 subcontratados\): Dotar al proveedor de manuales de procedimientos claros, formación, cambios estandarizados y criterios de escalación; supervisar su desempeño y su alineación con ITSM; impulsar la mejora continua. * Colaboración \& CI: Colaborar con Ingeniería de Plataforma para garantizar capacidades diseñadas desde el inicio para ser operables; incorporar conocimientos operativos en la hoja de ruta; orientar a colegas y promover una cultura de operaciones lideradas por ingeniería. Cualificaciones requeridas: * 5 años o más de experiencia en plataformas/SRE/operaciones/ingeniería de plataformas, con responsabilidad directa sobre entornos productivos a gran escala. * Experiencia práctica en operaciones híbridas (nube \+ local) con sólidos fundamentos empresariales en la nube (computación, redes, almacenamiento, identidad). * Infraestructura como código (IaC) y automatización en producción (Terraform, Ansible); escritura de scripts en Python/PowerShell/Bash (se prefiere especialmente Python). * Experiencia comprobada en resolución de problemas a nivel L3 y liderazgo en incidentes importantes. * Sólidos fundamentos de infraestructura: redes (incluidos los conceptos DNS/DHCP), virtualización, almacenamiento, Windows Server y/o Linux. * Experiencia con sistemas de gestión de servicios de TI (ITSM) (incidentes, problemas, cambios) y operaciones basadas en tickets. * Conocimiento de la plataforma Azure. Preferible/valorado: * Prácticas de SRE (SLO, presupuestos de errores, informes postmortem, reducción de tareas repetitivas). * Experiencia en operaciones de virtualización y copia de seguridad/recuperación ante desastres (backup/DR). * Conocimiento de contenedores y DevOps/CI/CD; control de desviaciones en la configuración. * Uso de Python para análisis operativo; familiaridad con ML/DL para detección de anomalías, pronósticos y agrupamiento (clustering). * Experiencia en operaciones grandes, multinacionales y continuas (24/7). * Conocimiento de enfoques basados en IA/agentes y patrones modernos de automatización. Atributos deseados: * Mentalidad de ingeniería; automatiza y estandariza para reducir tareas repetitivas. * Alto sentido de propiedad; líder tranquilo y estructurado en la gestión de incidentes. * Comunicador claro en entornos globales y matriciales; colaborador eficaz con equipos transversales y socios externos. * Capacidad para trabajar tanto en entornos en la nube como locales; documentación rigurosa; compromiso con la excelencia operativa. Competencias clave: * Ingeniería de confiabilidad de sitios (SRE)/ingeniería de operaciones * Automatización, IaC (Terraform/Ansible), scripting (Python/PowerShell/Bash) * Operaciones de infraestructura híbrida * Gestión de incidentes/problemas, RCA y mejora continua * Gestión de observabilidad y calidad de alertas (independiente de herramientas) * Habilitación de proveedores y gobernanza operativa * Operaciones basadas en datos y pensamiento orientado a AIOps **Habilidades clave** Automatización, Operaciones de Plataforma En TD SYNNEX, nuestros valores guían todo lo que hacemos: Juntos, Somos Responsables, Nos Atrevemos a Avanzar, Crecemos y Ganamos, y, sobre todo, Hacemos lo Correcto. Estos principios moldean nuestra forma de trabajar entre nosotros, con nuestros socios y con nuestras comunidades, mientras impulsemos la innovación y generemos un impacto duradero. **¿Qué obtienes tú?** * **Beneficios opcionales:** Nuestros programas están adaptados a tu país para ajustarse mejor a tu estilo de vida. * **Desarrolla tu carrera:** Acelera tu trayectoria hacia el éxito (y mantente actualizado con el futuro) mediante programas formales de liderazgo y desarrollo profesional, además de numerosos cursos disponibles bajo demanda. * **Potencia tu bienestar personal:** Mejora tu bienestar financiero, físico y mental mediante seminarios, eventos y nuestro Programa Global de Apoyo a la Vida. * **Diversidad, equidad e inclusión:** No es solo una frase para nosotros; valorar cada voz es cómo logramos el éxito. Únete a nosotros para celebrar nuestra diversidad global mediante educación inclusiva, conversaciones significativas entre pares y oportunidades equitativas de crecimiento y desarrollo. * **Aprovecha al máximo nuestra organización global:** Conéctate con otros nuevos compañeros de trabajo durante tus primeros 30 días mediante nuestro programa de incorporación. * **Conéctate con tu comunidad:** Participa en comunidades y actividades internas dirigidas por pares, incluidos grupos de recursos empresariales, eventos locales de voluntariado y más iniciativas ambientales y sociales. **¿No cumples todos los requisitos? ¡Aplica de todas formas!** En TD SYNNEX, nos sentimos orgullosos de ser reconocidos como un excelente lugar para trabajar y como líderes en la promoción y práctica de la diversidad, la equidad y la inclusión. Si te entusiasma trabajar en nuestra empresa y crees que eres un buen candidato para este puesto, ¡te animamos a aplicar! Podrías ser exactamente la persona que estamos buscando!


