Développeur principal en fiabilité des sites (SRE)
City : Montréal, Québec
Category : Permanent Temps plein
Industry : Technologies de l'information
Employer : National Bank
Une carrière en tant que Développeur en Ingénierie, Fiabilité des Sites (SRE) (Site Reliability Engineer ) dans l’équipe des Canaux Numériques, à la Banque Nationale, c’est agir à titre de spécialiste en fiabilité, en efficacité et en performance des systèmes sur des applications utilisées par près de 2 millions clients. C’est par tes compétences techniques solides, ta capacité à travailler en équipe, ta communication efficace, ta capacité à résoudre les problèmes de manière collaborative et ton engagement envers l'apprentissage continu que tu as un impact positif sur l'expérience client.
Ton emploi
- Promouvoir et mettre en oeuvre les bonnes pratiques de résilience et stabilité auprès des équipes.
- Accompagner et collaborer avec les équipes pour créer des systèmes fiables et évolutifs.
- Automatiser les tâches répétitives pour réduire l'intervention manuelle et minimiser les erreurs.
- Optimiser l'infrastructure et les applications pour améliorer la résilience et réduire les temps d'arrêt autant dans les environnements de non-production que de production.
- Contribuer à améliorer les processus de déploiement pour garantir des mises en production rapides et stables.
- Comprendre les flux principaux de nos environnements critiques et déceler les points de faiblesse unique (single point of failure).
- Analyser les défaillances pour en tirer des leçons et éviter les répétitions.
- Supporter les équipes T.I. afin d’améliorer leur support documentaire et diagramme d’architecture pour y inclure l’information de résilience et stabilité.
- Participer à la résolution des incidents en identifiant les causes et en appliquant des solutions efficaces.
- Participer à la surveillance en continu des systèmes et des applications pour détecter les anomalies de performance.
- Participer à la configuration des alertes pour signaler les incidents critiques et permettre une réaction rapide.
Ton équipe
Au sein du département de Livraison Numérique Particulier, tu fais partie d’une grande équipe d'une centaine de collègues. Notre équipe se démarque par son expertise en développement d'expérience client, sa qualité de livraison constante et son ambiance de collaboration dynamique.
La Banque valorise le développement continu et la mobilité interne. Nous offrons une variété d'occasions de croissance, telles que des formations spécialisées, des communautés de pratiques et des sessions de mentorat personnalisées avec des experts chevronnés. De plus, notre entreprise encourage activement la participation à des conférences et à des événements de l'industrie, offrant ainsi des opportunités d'apprentissage informel et de réseautage avec des pairs et des leaders d'opinion. Nous croyons fermement que l'apprentissage continu est essentiel pour rester à la pointe de l'industrie et nous investissons dans le développement professionnel de nos membres d'équipe, les aidant à réaliser leur plein potentiel tout en contribuant à notre succès collectif. Des outils tels que l’Académie de données, la formation linguistique, le Centre d’apprentissage Harvard et de l’accompagnement en coaching et en mentorat te sont accessibles en tout temps.
Prérequis
- Baccalauréat avec spécialité Technologie de l’Information.
- Expertise entre 5 ans et 8 ans en développement de services on lines dans un environnement complexe composé de nouvelles et anciennes technologies (Legacy).
- Excellente compréhension des principes DevSecOPS, surveillance et observabilité.
- Expertise en design logiciel de systèmes complexes supportant des milliers de clients concurrents et en surveillance d'écosystème complexe.
- Grande capacité à résoudre des problèmes complexes multi-systèmes.
- Maîtrise d'au moins un langage de programmation (Java, Javascript, Python, Go, Bash) pour le développement de scripts et l'automatisation des tâches.
- Maîtrise des principes DevOps et des outils CI/CD (Github, ArgoCD) pour la mise en œuvre de pipelines de déploiement continu.
- Expérience avec la plateforme cloud AWS (développement de services, déploiement, automatisation et opérations).
- Expérience en analyse de capacité infra (CPU, Memory, Latence, IO, Bandwidth etc).
- Solides compétences en réseaux (TCP/IP, DNS, Load Balancing, HTTP/HTTPS) pour diagnostiquer et résoudre les problèmes de connectivité.
- Maîtrise des outils de monitoring et de logging (Datadog / Splunk) pour surveiller la performance et diagnostiquer les systèmes.
- Expérience en tests de charges et analyse.
- Expérience en gestion de bases de données relationnelles et non relationnelles (MongoDB, Redis) pour garantir leur disponibilité et performance.
- Compréhension des pratiques de sécurité informatique pour sécuriser les systèmes et les données.
- Expérience en gestion des incidents et analyse post-mortem pour améliorer la fiabilité des services.
- Programme santé et bien-être incluant de nombreuses options
- Assurance collective flexible
- Régime de retraite généreux
- Régime d’acquisition d’actions
- Programme d’aide aux employées et employés ainsi qu’à leur famille
- Services bancaires préférentiels
- Implication dans des initiatives communautaires
- Service de télémédecine
- Clinique virtuelle d’amélioration du sommeil