Ingeniero Senior de Investigación en IA, Inferencia de Modelos (100 % remoto)

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Lambayeque 284, Lima 15093, Perú

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Tether busca un Ingeniero de Modelos de IA experimentado para ampliar los límites del rendimiento de inferencia y ajuste fino en escritorio y en dispositivo para SLM/LLM de próxima generación. Aspectos destacados: 1. Dar forma al futuro de las finanzas digitales con soluciones pioneras 2. Colaborar con mentes brillantes en una potencia global de talento remoto 3. Impulsar avances en inteligencia artificial y tecnología entre pares ***Únase a Tether y dé forma al futuro de las finanzas digitales*** En Tether, no solo construimos productos, sino que lideramos una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether le permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo ello a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando la confianza en cada transacción. ***Innovar con Tether*** **Finanzas Tether:** Nuestra innovadora suite de productos incluye la moneda estable más confiable del mundo, **USDT**, utilizada por cientos de millones de personas en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin mediante prácticas ecológicas en instalaciones de última generación y geográficamente diversas. **Tether Data:** Impulsando avances en inteligencia artificial y tecnología entre pares, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como **KEET**, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. **Tether Education:** Democratizando el acceso al aprendizaje digital de primer nivel, empoderamos a las personas para que prosperen en las economías digital y gig, impulsando el crecimiento y las oportunidades globales. **Tether Evolution:** En la intersección entre la tecnología y el potencial humano, estamos expandiendo los límites de lo posible, diseñando un futuro en el que la innovación y las capacidades humanas se fusionen de maneras poderosas e inéditas. ***¿Por qué unirse a nosotros?*** Nuestro equipo es una potencia global de talento que trabaja de forma remota desde todos los rincones del planeta. Si le apasiona dejar su huella en el sector fintech, esta es su oportunidad para colaborar con algunas de las mentes más brillantes, desafiando los límites y estableciendo nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y consolidando nuestro lugar como líderes en la industria. Si posee excelentes habilidades de comunicación en inglés y está listo para contribuir a la plataforma más innovadora del planeta, ¡Tether es el lugar indicado para usted! **¿Está listo para formar parte del futuro?** **Acerca del puesto:** Buscamos un Ingeniero de Modelos de IA experimentado con profunda experiencia en desarrollo de kernels, optimización de modelos, ajuste fino y aceleración GPU. El ingeniero ampliará el marco de inferencia para soportar inferencia y ajuste fino de modelos de lenguaje, centrándose especialmente en la aceleración GPU móvil e integrada (Vulkan). Este puesto requiere experiencia práctica con técnicas de cuantización, arquitecturas LoRA, backend Vulkan y depuración de GPU móvil. Usted desempeñará un papel fundamental para ampliar los límites del rendimiento de inferencia y ajuste fino en escritorio y en dispositivo para SLM/LLM de próxima generación. **Responsabilidades**: * Implementar y optimizar kernels personalizados de inferencia y ajuste fino para modelos pequeños y grandes de lenguaje en múltiples backends de hardware. * Implementar y optimizar ajustes finos completos y basados en LoRA para modelos pequeños y grandes de lenguaje en múltiples backends de hardware. * Diseñar y ampliar el soporte para tipos de datos y precisión (int, float, precisión mixta, QTypes ternarios, etc.). * Diseñar, personalizar y optimizar shaders de cómputo Vulkan para operadores cuantizados y flujos de trabajo de ajuste fino. * Investigar y resolver problemas de aceleración GPU en Vulkan y GPUs integradas/móviles. * Arquitecturar y preparar el soporte para técnicas avanzadas de cuantización con el fin de mejorar la eficiencia y el uso de memoria. * Depurar y optimizar operadores GPU (por ejemplo, int8, fp16, fp4, ternarios). * Integrar y validar flujos de trabajo de cuantización para entrenamiento e inferencia. * Realizar evaluaciones y pruebas comparativas (por ejemplo, pruebas de perplejidad, rendimiento de adaptadores ajustados finamente). * Realizar pruebas GPU en dispositivos de escritorio y móviles. * Colaborar con equipos de investigación e ingeniería para prototipar, evaluar y escalar nuevos métodos de optimización de modelos. * Entregar implementaciones de modelos de lenguaje eficientes y aptas para producción en casos de uso móviles y de borde. * Trabajar estrechamente con equipos multifuncionales para integrar marcos optimizados de servicio e inferencia en tuberías de producción diseñadas para aplicaciones de borde y en dispositivo. Definir métricas claras de éxito, como mejora del rendimiento en entornos reales, bajos índices de error, escalabilidad robusta, uso óptimo de memoria y asegurar un monitoreo continuo y refinamientos iterativos para lograr mejoras sostenidas. * Competencia en C\+\+ y programación de kernels GPU. * Experiencia demostrada en aceleración GPU con el framework Vulkan. * Sólida formación en cuantización y optimización de modelos con precisión mixta. * Experiencia y conocimientos especializados en desarrollo y personalización de shaders de cómputo Vulkan. * Conocimiento práctico de ajuste fino LoRA y métodos de entrenamiento eficientes en parámetros. * Capacidad para depurar problemas específicos de rendimiento y estabilidad de GPU en dispositivos de escritorio y móviles. * Experiencia práctica en aceleración GPU móvil y en inferencia de modelos. * Conocimiento de arquitecturas de modelos de lenguaje grande (por ejemplo, Qwen, Gemma, LLaMA, Falcon, etc.). * Experiencia en la implementación de operadores personalizados hacia atrás para ajuste fino. * Experiencia en la creación y curación de conjuntos de datos personalizados para transferencia de estilo y ajuste fino específico de dominio. * Capacidad demostrada para aplicar investigación empírica para superar desafíos en modelos **Información importante para los candidatos** Los fraudes relacionados con reclutamiento se han vuelto cada vez más comunes. Para protegerse, tenga en cuenta lo siguiente al postularse a puestos: * **Postúlese únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para reclutamiento, salvo que se indique expresamente. Todos los puestos disponibles aparecen en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifique la identidad del reclutador.** Todos nuestros reclutadores cuentan con perfiles verificados en LinkedIn. Si tiene dudas, puede confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Sea cauteloso con métodos inusuales de comunicación.** No realizamos entrevistas a través de WhatsApp, Telegram ni SMS. Toda la comunicación se lleva a cabo mediante correos electrónicos y plataformas oficiales de la empresa. * **Verifique cuidadosamente las direcciones de correo electrónico.** Toda la comunicación proveniente de nosotros tendrá como dominio final **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni datos financieros personales.** Si alguien le solicita información financiera personal o un pago en cualquier etapa del proceso de contratación, se trata de un fraude. Por favor, denúncielo inmediatamente. **Si tiene dudas, no dude en contactarnos a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original