Compétences recherchées — Connectez-vous et téléversez votre CV pour comparer avec votre profil
Gouvernance Intelligence artificielle SQL +9 autres

Détails du poste

  • Lieu de travail : Montreal
  • Type de poste : Permanent à temps plein

À propos d’Alexa Translations

Alexa Translations fournit des traductions propulsées par l’IA pour les plus grandes et les institutions juridiques, financières et gouvernementales les plus prestigieuses.

Notre combinaison unique de technologie avancée et de traducteurs professionnellement certifiés offre des solutions sur mesure d’une qualité inégalée.

Grâce à plus de deux décennies de réussite client primée, vous pouvez compter sur nous en tant qu’extension véritable de votre équipe.

Nos valeurs fondamentales : Innovation, Engagement, Engagement fanatique envers la qualité et le service, Ingéniosité, Collaboration.

Présentation du poste

En tant qu’Ingénieur Data (Team Lead), vous serez le responsable technique et dirigerez une équipe spécialisée à l’intersection du Big Data, des Communications Mondiales et de la GenAI.

Vous superviserez le développement de notre Data Warehouse d’entreprise, en veillant à ce que nos ressources linguistiques (TMs, Glossaires et Métadonnées) soient structurées, consultables et optimisées pour les traducteurs humains, les recherches en traduction automatique et les modèles d’apprentissage machine.

Au-delà du data engineering traditionnel, vous collaborerez avec plusieurs équipes à la conception de l’interface de la plateforme et des stratégies d’indexation qui alimentent nos workflows de localisation de nouvelle génération.

Votre valeur unique consiste à faire le pont entre l’architecture des données de haut niveau, le domaine de la traduction aux nuances spécifiques et les exigences émergentes de la Retrieval-Augmented Generation (RAG).

Principales responsabilités

Stratégie des données & architecture du stockage

  • Définir la feuille de route de notre data warehouse, en assurant une haute disponibilité et des performances pour de vastes ensembles de données multilingues.
  • Mettre en œuvre des solutions robustes de catalogage pour garantir la traçabilité des données et la « découvrabilité » à travers l’organisation.
  • Diriger la création d’une interface centrée utilisateur permettant aux parties prenantes d’interagir avec, d’interroger et d’extraire des données de la plateforme.

Domaine de la traduction & de la localisation

  • Gérer le cycle de vie des Translation Memories (TMs) et des bases de données terminologiques.
  • Optimiser les intégrations entre notre plateforme de données et les outils CAT et les systèmes TMS (par ex. Phrase, Trados, MemoQ).
  • Veiller à ce que les pipelines de données respectent les nuances des métadonnées de traduction, les structures XLIFF et les variantes régionales.

Intégration ML & GenAI

  • RAG & indexation : superviser la création et la maintenance des Vector Databases et des index de recherche sémantique pour prendre en charge la Retrieval-Augmented Generation pour la traduction automatisée et la création de contenu.
  • Préparation des données pour les LLMs : concevoir des pipelines qui nettoient, découpent et mettent en forme les données de localisation pour un fine-tuning ou des requêtes pour les Large Language Models (LLMs).
  • Qualité & évaluation : soutenir la mise en œuvre d’une estimation automatisée de la qualité (QE) et de métriques d’évaluation basées sur les LLM pour le contenu traduit.

Leadership & mentorat

  • Gérer une équipe pluridisciplinaire de linguistes, développeurs logiciels, Devops et ingénieurs en localisation, en fournissant des conseils techniques et du mentorat.
  • Assurer l’interface entre les équipes Data, Localisation et Recherche en IA/ML.

Qualifications requises

  • Expérience : 5+ ans en Data Engineering.
  • Stack technique : maîtrise de SQL, Python, des pipelines ETL et des plateformes cloud de données (par ex. AWS S3 Data Lakes, AWS Athena, AWS Redshift, AWS Glue).
  • Fondamentaux IA/ML : bonne compréhension du cycle de vie de la GenAI, en particulier sur la manière dont les données sont indexées pour la RAG (par ex. Pinecone, Milvus ou Qdrant).
  • Connaissances du domaine : compréhension de l’industrie de la localisation, y compris l’expérience avec les flux de travail TMX, TBX et des outils CAT.
  • Esprit produit : expérience dans la création et le déploiement d’outils ou d’interfaces internes prêts pour la production (par ex. Streamlit, React) afin de démocratiser l’accès aux données.

Compétences appréciées

  • Connaissance des modèles d’embedding et du scoring de similarité sémantique.
  • Connaissances de la confidentialité des données (ISO 27001, GDPR), spécifiquement concernant la PII dans les ensembles de données linguistiques.

Ce que nous offrons

Avantages & privilèges

  • Assurance santé complète : incluant vision, dentaire, thérapies complémentaires, et accompagnement pour votre bien-être global.
  • Votre jour d’anniversaire : nous célébrons votre journée spéciale !
  • 6 jours personnels/maladie : prenez le temps nécessaire pour votre santé ou les moments imprévus de la vie.
  • Équipement prêt pour le travail : obtenez les outils dont vous avez besoin pour réussir, fournis sur demande.
  • Modèle de travail hybride : profitez du meilleur des deux mondes avec une combinaison de collaboration en présentiel et de flexibilité à distance.
  • Opportunités d’apprentissage & de développement : formations et ressources adaptées à votre rôle et à votre département.
  • Culture d’équipe bienveillante & collaborative : travaillez avec des membres d’équipe qui vous soutiennent vraiment.
  • Récompenses de reconnaissance d’équipe & d’actions : célébrez les réussites et les contributions de manière significative.
  • Programme de recommandation d’employés : gagnez des récompenses en apportant des talents exceptionnels à notre équipe.
  • #Li-hybrid Propulsé par JazzHR