Estamos formando un equipo seleccionado para construir una solución tecnológica innovadora en Latinoamérica. Desarrollamos inteligencia artificial de frontera enfocada en procesamiento de texto en español, atendiendo a un problema real con clientes listos para la implementación.

Si tienes pasión por la optimización de algoritmos, la depuración de código y ver cómo una curva de pérdida finalmente converge, eres la persona que buscamos.

Diseñarás y ejecutarás el pipeline completo: corpus, Continual Pre-Training (CPT), Supervised Fine-Tuning (SFT), RLHF, cuantización y despliegue en hardware propietario. Ofrecemos un entorno con alta autonomía, responsabilidad y un desafío técnico avanzado.

Funciones principales:
Preparar y tokenizar conjuntos de datos de texto en español a gran escala.
Ejecutar Continual Pre-Training sobre modelos base de código abierto en infraestructura de GPUs dedicadas.
Realizar ajuste fino supervisado (Fine-tuning) con LoRA y QLoRA utilizando el ecosistema de HuggingFace y TRL.
Diseñar y operar pipelines de RLHF y DPO con anotadores de dominio.
Cuantizar el modelo final para despliegue local (on-premise) utilizando GGUF y MLX en hardware específico.
Construir sistemas de recuperación de información (RAG) sobre pgvector.
Diseñar métricas de evaluación rigurosas para la validación de los modelos.

Requisitos indispensables:

Dominio avanzado de Python.
Experiencia práctica demostrable con PyTorch y HuggingFace Transformers.
Experiencia en Fine-tuning de LLMs en entornos de producción (SFT, LoRA, QLoRA).
Manejo fluido de entornos Linux mediante línea de comandos.
Experiencia en gestión de grandes volúmenes de datos (procesos ETL, tokenización y pipelines).
Dominio nativo u operativo avanzado (C2) del idioma español para la evaluación de textos.

Requisitos deseables:

Conocimiento de MLX para Apple Silicon.
Experiencia con RLHF, DPO y Reward Modeling.
Manejo de herramientas como Unsloth, DeepSpeed o FSDP.
Conocimientos en cuantización: GGUF, GPTQ, AWQ.
Experiencia con pgvector o bases de datos vectoriales.
Familiaridad con llama.cpp y Ollama.

Ofrecemos:

Sueldo competitivo acorde a la experiencia técnica demostrada.
Prestaciones superiores a las de la ley.
Modalidad de trabajo 100% remota.
Infraestructura y hardware dedicado para el entrenamiento de modelos.
Rol fundacional con impacto directo en las decisiones de arquitectura.
Flexibilidad de horario basada en el cumplimiento de objetivos.

Proceso de selección:
Por políticas de la plataforma, favor de postularse directamente a través del botón de este portal manteniendo actualizado tu perfil, incluyendo tu portafolio o enlaces a repositorios de código relevantes (proyectos de fine-tuning o entrenamiento) en tu información adjunta. El código demostrable será evaluado en las primeras etapas del proceso.

ML Engineer

Descripción del puesto

Sobre quien publica

Empleos similares

Becarios

Analista de procesos

Operador producción