Responsable – Surveillance des applications et observabilité /Application Monitoring &
MCD McKesson Canada Corporation / La Corporation McKesson Canada
Détails du poste
- Lieu de travail : Montreal
- Type de poste : Permanent à temps plein
Description du poste
Responsable Surveillance des Applications et Observabilité
Résumé
Responsable de définir et de mettre en œuvre une approche cohérente et à l’échelle de l’entreprise en matière de surveillance des applications, d’observabilité et de support opérationnel. Ce rôle pilote l’adoption de pratiques standardisées, d’outils et de processus proactifs afin d’améliorer la fiabilité, la visibilité et la performance des systèmes.
Vos responsabilités
- Définir et déployer une stratégie unifiée de surveillance et d’observabilité pour l’ensemble des applications
- Standardiser les outils, les métriques, les seuils d’alerte et les pratiques à travers les équipes
- Mettre en place des tableaux de bord centralisés pour assurer une visibilité complète de la santé des systèmes
- Identifier les lacunes en matière de couverture de surveillance et mettre en œuvre des améliorations
- Mettre en place des mécanismes de détection proactive des anomalies et de la dégradation des performances
- Réduire les incidents en production grâce à des pratiques préventives basées sur les données
- Définir et suivre les indicateurs clés (disponibilité, performance, fiabilité, temps de rétablissement)
- Diriger les analyses de causes profondes et assurer la mise en place d’actions correctives durables
- Identifier et mettre en œuvre des opportunités d’automatisation
- Concevoir et encadrer la création de scripts, de workflows et de runbooks automatisés
- Réduire les interventions manuelles et améliorer l’efficacité opérationnelle
- Promouvoir des systèmes résilients et auto-correctifs
- Définir et faire respecter les standards opérationnels, les modèles de gouvernance et les responsabilités
- Assurer l’alignement des équipes sur des pratiques cohérentes et évolutives
- Garantir le respect des exigences de sécurité, d’audit et de performance
- Agir comme leader transversal auprès des équipes développement, QA, opérations et support
- Collaborer étroitement avec les responsables de service et les équipes de livraison
- Conduire le changement organisationnel et promouvoir une culture d’excellence opérationnelle
- Fournir des tableaux de bord à destination de la direction
- Analyser les tendances et recommander des améliorations stratégiques
- Piloter les initiatives d’amélioration continue et assurer leur adoption durable
Votre profil
- Solide expertise en support applicatif, opérations, surveillance et observabilité
- Expérience avérée dans la mise en place de standards et pratiques à l’échelle de l’entreprise
- Excellente compréhension des environnements cloud, infrastructure et applications d’entreprise
- Expérience en automatisation, scripting et optimisation des opérations
- Forte capacité d’influence et de leadership sans autorité hiérarchique directe
- Capacité à remettre en question les pratiques existantes et à piloter le changement
- Orientation résultats avec un fort focus sur la performance et l’amélioration continue
Exigences minimales
- Diplôme ou expérience équivalente et nécessite généralement 10 ans ou plus d’expérience pertinente. Moins d’années sont requises en cas de maîtrise ou de doctorat dans un domaine pertinent.
Compétences et expériences souhaitées
- Expérience avec des outils modernes d’observabilité (Datadog, Dynatrace, Splunk, New Relic)
- Connaissance des pratiques SRE (SLI/SLO) et fiabilité des systèmes
- Expérience dans des environnements d’entreprise à grande échelle ou réglementés
- Familiarité avec les environnements DevOps, CI/CD et architectures cloud-native
- Expérience dans des initiatives de transformation ou de standardisation à l’échelle de l’entreprise
Application Monitoring & Observability Lead
Summary
Lead the definition and implementation of a consistent, enterprise-wide approach to application monitoring, observability, and operational support. This role drives standardized practices, tooling, and proactive operations to improve system reliability, visibility, and performance across all teams.
What You’ll Do
- Define and implement a unified monitoring and observability strategy across all applications
- Standardize tools, metrics, alerting thresholds, and practices across engineering and operations teams
- Establish centralized dashboards to provide full visibility into system health and performance
- Identify gaps in monitoring coverage and implement improvements
- Develop proactive detection mechanisms to identify anomalies and performance degradation
- Reduce incidents through preventive, data-driven practices
- Define and track key operational metrics such as availability, performance, reliability, and recovery time
- Lead root cause analysis and ensure sustainable corrective actions
- Drive automation across monitoring, alerting, and operational workflows
- Guide development of scripts, automated runbooks, and self-healing capabilities
- Improve efficiency by reducing manual intervention
- Define and enforce operational standards, governance models, and accountability frameworks
- Ensure compliance with security, audit, and performance requirements
- Align teams to consistent, scalable operational practices
- Act as a cross-functional leader across development, QA, operations, and support teams
- Partner with service managers and delivery teams to drive adoption of best practices
- Lead organizational change and promote a culture of operational excellence
- Deliver executive-level dashboards and insights on system performance
- Analyze trends and recommend strategic improvements
- Lead continuous improvement initiatives and ensure long-term adoption of best practices
What You Bring
- Deep expertise in application support, monitoring, observability, and operations
- Proven experience implementing enterprise-wide standards and cross-team practices
- Strong understanding of cloud platforms, infrastructure, and enterprise applications
- Experience with automation, scripting, and operational optimization
- Strong leadership and influencing skills without direct authority
- Ability to drive change, challenge existing practices, and improve operational maturity
- Results-oriented mindset focused on reliability, performance, and continuous improvement
Minimum Requirements
- Degree or equivalent and typically requires 10+ years of relevant experience. Less years required if has relevant Master’s or Doctorate qualifications.
Preferable Skills & Experience
- Experience with modern observability platforms (e.g., Datadog, Dynatrace, Splunk, New Relic)
- Knowledge of SRE practices, SLIs/SLOs, and reliability engineering principles
- Experience in large-scale enterprise or highly regulated environments
- Familiarity with CI/CD, DevOps, and cloud-native architectures
- Prior experience driving enterprise transformations or platform standardization
We are proud to offer a competitive compensation package at McKesson as part of our Total Rewards. This is determined by several factors, including performance, experience and skills, equity, regular job market evaluations, and geographical markets. The pay range shown below is aligned with McKesson's pay philosophy, and pay will always be compliant with any applicable regulations. In addition to base pay, other compensation, such as an annual bonus or long-term incentive opportunities may be offered. For more information regarding benefits at McKesson, please
Our Base Pay Range for this position
$116,300 - $193,800
McKesson has become aware of online recruiting-related scams in which individuals who are not affiliated with or authorized by McKesson are using McKesson’s (or affiliated entities, like CoverMyMeds or RxCrossroads) name in fraudulent emails, job postings or social media messages. In light of these scams, please bear the following in mind:
McKesson Talent Advisors will never solicit money or credit card information in connection with a McKesson job application.
McKesson Talent Advisors do not communicate with candidates via online chatrooms or using email accounts such as Gmail or Hotmail. Note that McKesson does rely on a virtual assistant (Gia) for certain recruiting-related communications with candidates.
McKesson job postings are posted on our career site: .