Développeur IA Python

Constellio Inc.

Montreal

Offre publiée le 2026-02-14

Postuler

Description du Poste

Nous recherchons un développeur Python spécialisé en intelligence artificielle générative pour concevoir et intégrer des fonctionnalités basées sur des modèles de langage (LLM), de la recherche sémantique et des pipelines d’embeddings au sein d’applications backend. Le rôle combine développement Python, intégration LLM, architectures RAG (Retrieval-Augmented Generation) et déploiement cloud.

Responsabilités Principales :

1. Développement IA, LLM et prompt engineering :

Concevoir, optimiser et maintenir des prompts (prompt engineering) incluant system, few‑shot et chaînes de prompts.
Intégrer des modèles LLM (OpenAI / Azure OpenAI) dans des services backend.
Configurer les paramètres de génération (température, top‑k, contexte).
Gérer l’utilisation des tokens, les coûts et la qualité des réponses générées.

2. Recherche sémantique & embeddings :

Mettre en place des pipelines d’embeddings pour documents et requêtes.
Réaliser de la recherche vectorielle dans une base (ex. ChromaDB ou FAISS).
Contribuer au développement d’architectures RAG pour améliorer la précision et la factualité.

3. Backend Python & API :

Développer des APIs robustes avec Flask ou FastAPI, incluant documentation OpenAPI.
Gérer le streaming des réponses LLM, la gestion d’erreurs et la journalisation.
Participer à la mise en place de tâches asynchrones (Celery/Redis) pour ingestion ou indexation.

4. Cloud & déploiement :

Déployer les services IA et backend dans Azure (App Services, Container Apps, Key Vault).
Concevoir et maintenir des images Docker ; connaissance des environnements Kubernetes (AKS).
Appliquer des bonnes pratiques de sécurité (OAuth2/OIDC, gestion des secrets).

Compétences requises :

Essentielles :

Excellente maîtrise de Python et d’un framework API (Flask ou FastAPI).
Expérience concrète avec les APIs LLM (OpenAI / Azure OpenAI).
Connaissance des concepts RAG, embeddings et recherche vectorielle.
Compétences en prompt engineering (incluant optimisation et structuration des prompts).
Déploiement et intégration cloud dans Azure.
Maîtrise de Docker ; bonnes bases en Kubernetes.
Compréhension des mécanismes de sécurité API (OAuth2, OIDC, JWT).

Atouts :

Connaissance de LangChain ou LlamaIndex.
Expérience avec Celery/Redis, PostgreSQL, Pydantic.
Familiarité avec le NLP francophone.
Expérience CI/CD (GitLab, Azure Pipelines).

Profil recherché :

Diplôme en informatique, IA ou équivalent.
Expérience de 3 ans minimum en intégration LLM/IA dans des applications backend.
Capacité à travailler en cloud et à résoudre des enjeux techniques complexes.
Rigueur, autonomie et bonne communication.
Bilingue français / anglais.

Avantages :

Poste à 100% Télétravail
Rémunération attractive.
Opportunités de développement professionnel et de carrière.
Environnement de travail stimulant et respectueux.
Participation à des projets innovants avec des entreprises de renom.

Rejoignez une équipe dynamique et innovante, où vos compétences seront valorisées et où vous aurez l'occasion de faire une réelle différence dans la qualité de nos produits. Profitez d’un environnement de travail collaboratif qui encourage l’excellence et la croissance personnelle.