Connexion

Détails du poste

  • Lieu de travail : Montreal
  • Type de poste : Permanent à temps plein

Job Description

Role Summary

We are seeking an MLOps Engineer with experience building and scaling infrastructure for large 2D and 3D media datasets and training machine learning models on them. You will be responsible for the "backbone" of our machine learning lifecycle, ensuring that our data and training pipelines are automated, reproducible, and performant at scale.

Responsibilities

  • Cross-Functional Coordination: Work with partner ML and Annotation engineers and TPMs to spec out infrastructure and training requirements.
  • Pipeline Automation: Design and maintain robust CI/CD and CT (Continuous Training) pipelines for complex multimodal models.
  • Data Lifecycle Management: Implement versioning and storage strategies for massive 2D/3D datasets to ensure reproducibility and high-throughput access.
  • Monitoring & Observability: Deploy and manage systems for monitoring model performance and data drift in production environments.

Résumé du poste

Nous recherchons une personne Ingénieure MLOps possédant de l’expérience dans la conception et la mise à l’échelle d’infrastructures pour de vastes jeux de données multimédias 2D et 3D, ainsi que dans l’entraînement de modèles d’apprentissage automatique sur ceux‑ci. Vous serez responsable de l’« ossature » de notre cycle de vie d’apprentissage automatique, en veillant à ce que nos pipelines de données et d’entraînement soient automatisés, reproductibles et performants à grande échelle.

Responsabilités

  • Concevoir l’architecture de bout en bout du cadre CGU : modèles de données, systèmes d’exécution et points d’extensibilité
  • Concevoir et faire évoluer des API qui exposent les systèmes de gameplay de manière sécuritaire et flexible aux créateur·rice·s
  • Définir le modèle de script (langage, environnement d’exécution) pour le contenu créé par les utilisateur·rice·s
  • Collaborer avec les équipes IA/ML afin de permettre un agent IA capable de générer, modifier et raisonner sur du contenu de gameplay
  • Mettre en place des garde-fous : budgets de performance, isolation (sandboxing), sécurité et déterminisme
  • Travailler étroitement avec les équipes gameplay, en ligne et outils afin d’assurer la cohérence de la plateforme
  • Orienter la direction technique au moyen de prototypes, de documentation et d’implémentations concrètes
  • Encadrer les ingénieur·e·s et influencer les normes d’ingénierie à l’échelle des équipes

Qualifications

  • Graduate degree in Computer Science, Software Engineering, or a related field.
  • 5+ years of experience as an MLOps Engineer in a fast-paced environment in applied machine learning.
  • Technical Proficiency:Core Tools: Fluency with Python, Git, and the Unix shell.Containerization & Orchestration: Deep familiarity with Docker, Kubernetes, and workflow orchestrators (, Airflow, Prefect, or Kubeflow).Ecosystem: Familiarity with collaborative tools such as Jira/Confluence, Slack and a Git Mathematical Background: Preferred for understanding the resource demands of 3D data transformations.

Desired Characteristics

  • High attention to detail regarding system reliability and data security.
  • Ability to translate abstract ML requirements into concrete, scalable cloud or on-prem infrastructure.
  • Prior experience in industries with complex multi-disciplinary teams such as robotics, smart grids, precision agriculture, game development, or aerospace.

Eligibility Requirements

  • Interested candidates must apply to be considered.
  • Must be legally authorized to work in Canada.
  • Must be willing to travel for work related business, if necessary

Qualifications de base

  • Diplôme d’études supérieures en informatique, en génie logiciel ou dans un domaine connexe.
  • Plus de 5 ans d’expérience à titre d’ingénieur·e MLOps dans un environnement dynamique en apprentissage automatique appliqué.
  • Compétences techniques : Outils de base : Maîtrise de Python, de Git et de l’environnement Unix.Conteneurisation & orchestration : Solide connaissance de Docker, de Kubernetes et des orchestrateurs de flux de travail (p. ex., Airflow, Prefect ou Kubeflow).Écosystème : Connaissance des outils collaboratifs tels que Jira/Confluence, Slack et un serveur Git. Solide formation mathématique : Souhaitée afin de comprendre les exigences en ressources liées aux transformations de données 3D.

Atouts souhaités

  • Grand souci du détail en matière de fiabilité des systèmes et de sécurité des données.
  • Capacité à traduire des exigences abstraites en apprentissage automatique en infrastructures concrètes et évolutives, infonuagiques ou sur site.
  • Expérience préalable dans des secteurs comportant des équipes multidisciplinaires complexes, tels que la robotique, les réseaux intelligents, l’agriculture de précision, le développement de jeux ou l’aérospatiale.

Exigences d’admissibilité

  • Les personnes intéressées doivent soumettre leur candidature afin d’être considérées.
  • Doit être légalement autorisé·e à travailler au Canada.
  • • Doit être disposé·e à se déplacer pour des raisons professionnelles, au besoin.

Additional Information

As part of our selection process, external candidates may be required to attend an in-person interview with an NBCUniversal employee at one of our locations prior to a hiring decision. NBCUniversal's policy is to provide equal employment opportunities to all applicants and employees without regard to race, color, religion, creed, gender, gender identity or expression, age, national origin or ancestry, citizenship, disability, sexual orientation, marital status, pregnancy, veteran status, membership in the uniformed services, genetic information, or any other basis protected by applicable law.

If you are a qualified individual with a disability or a disabled veteran and require support throughout the application and/or recruitment process as a result of your disability, you have the right to request a reasonable accommodation. You can submit your request to AccessibilityS.