Notre client est à la recherche d'un(e) Ingénieur de la fiabilité des sites (SRE) bilingue sénior pour participer au développement d'un parc applicatif au sein de l'équipe d'assurances.
Contrat initial de 6 mois, hybride à Montréal, QC (3 jours / semaine en teletravail, 2 jours / semaine au bureau).
Responsabilités :
- Identifier les choses à mettre en place pour faciliter les activités quotidiennes d’opération et administration des environnements technologiques et applicatifs en production
- Proposer et implanter des améliorations en fonction des tendances et opportunités pour améliorer la fiabilité des environnements
- Élaborer, implanter et maintenir les systèmes de monitoring et d’alertes requis pour détecter proactivement les incidents et réagir rapidement
- Documenter et développer le code requis pour automatiser les activités d’opérations quotidiennes
- Développer le code requis pour supporter la gestion des erreurs
- Développer le code requis pour automatiser les activités de résolution d’incident pour améliorer la fiabilité des environnements
- Maintenir les indicateurs de niveaux de services pour permettre d’équilibrer les efforts entre l’amélioration de la fiabilité et l’ajout de fonctionnalité
- Collaborer avec l’équipe pour s’assurer que les pipe-line de CI / CD sont efficaces
- Documenter des processus de livraison des produits et des environnements technologiques les supportant
- Avoir une mentalité d’amélioration continue, excellence de service et d’automatisation
Exigences :
- 5+ années d'expérience en tant qu' Ingénieur de la fiabilité des sites
- Très bonne connaissance de AWS pour la gestion de notre infrastructure
- Splunk et Datadog pour les métriques systèmes et le profiling
- Bitbucket pour la gestion des versions de nos scripts et outils
- Excellente communication en francais et anglais
Atouts :
- Connaissance de GitHub
- Connaissance de Jenkins
3 days ago