ML Engineer
Descripción del puesto
Estamos formando un equipo seleccionado para construir una solución tecnológica innovadora en Latinoamérica. Desarrollamos inteligencia artificial de frontera enfocada en procesamiento de texto en español, atendiendo a un problema real con clientes listos para la implementación.
Si tienes pasión por la optimización de algoritmos, la depuración de código y ver cómo una curva de pérdida finalmente converge, eres la persona que buscamos.
Diseñarás y ejecutarás el pipeline completo: corpus, Continual Pre-Training (CPT), Supervised Fine-Tuning (SFT), RLHF, cuantización y despliegue en hardware propietario. Ofrecemos un entorno con alta autonomía, responsabilidad y un desafío técnico avanzado.
Funciones principales:
Preparar y tokenizar conjuntos de datos de texto en español a gran escala.
Ejecutar Continual Pre-Training sobre modelos base de código abierto en infraestructura de GPUs dedicadas.
Realizar ajuste fino supervisado (Fine-tuning) con LoRA y QLoRA utilizando el ecosistema de HuggingFace y TRL.
Diseñar y operar pipelines de RLHF y DPO con anotadores de dominio.
Cuantizar el modelo final para despliegue local (on-premise) utilizando GGUF y MLX en hardware específico.
Construir sistemas de recuperación de información (RAG) sobre pgvector.
Diseñar métricas de evaluación rigurosas para la validación de los modelos.
Requisitos indispensables:
Dominio avanzado de Python.
Experiencia práctica demostrable con PyTorch y HuggingFace Transformers.
Experiencia en Fine-tuning de LLMs en entornos de producción (SFT, LoRA, QLoRA).
Manejo fluido de entornos Linux mediante línea de comandos.
Experiencia en gestión de grandes volúmenes de datos (procesos ETL, tokenización y pipelines).
Dominio nativo u operativo avanzado (C2) del idioma español para la evaluación de textos.
Requisitos deseables:
Conocimiento de MLX para Apple Silicon.
Experiencia con RLHF, DPO y Reward Modeling.
Manejo de herramientas como Unsloth, DeepSpeed o FSDP.
Conocimientos en cuantización: GGUF, GPTQ, AWQ.
Experiencia con pgvector o bases de datos vectoriales.
Familiaridad con llama.cpp y Ollama.
Ofrecemos:
Sueldo competitivo acorde a la experiencia técnica demostrada.
Prestaciones superiores a las de la ley.
Modalidad de trabajo 100% remota.
Infraestructura y hardware dedicado para el entrenamiento de modelos.
Rol fundacional con impacto directo en las decisiones de arquitectura.
Flexibilidad de horario basada en el cumplimiento de objetivos.
Proceso de selección:
Por políticas de la plataforma, favor de postularse directamente a través del botón de este portal manteniendo actualizado tu perfil, incluyendo tu portafolio o enlaces a repositorios de código relevantes (proyectos de fine-tuning o entrenamiento) en tu información adjunta. El código demostrable será evaluado en las primeras etapas del proceso.
Sobre quien publica
Empleos similares
Becarios
Becario para Grupo Bari Estamos buscando Becarios para unirse a nuestro equipo en una posición de medio tiempo como Becario, serás parte de un entorno dinámico y colaborativo donde podrás aplicar tus habilidades y co...
Analista de procesos
Se busca Analista de procesos para unirse al equipo de producción de Grupo Bari. En esta posición, tu funcion será elaborar y actualizar manuales de procesos, realizar documentacion sobre procedimientos operativos, po...
Operador producción
¡Únete a nuestro equipo de Impresión! Estamos buscando a nuestro próximo Operador de Producción. Si eres una persona proactiva, con ganas de aprender y te gusta el trabajo operativo, ¡esta oportunidad es para ti! ...