KLANIK est une société de conseil en Ingénierie IT qui accompagne ses clients dans leurs projets digitaux et technologiques.
Le groupe KLANIK compte désormais plus de 750 talents, évoluant dans 16 agences en Europe, Amérique du Nord, Afrique et Moyen-Orient.
Des experts engagés, atypiques et passionnés, impliqués dans des projets stratégiques grâce à leur haut niveau de compétences en Software, DevOps, Cloud, Agilité, Cybersécurité, Big Data & IA.
En parallèle de leurs métiers, les collaborateurs du groupe KLANIK sont accompagnés au quotidien dans leur développement personnel et professionnel, via différentes initiatives engageantes et innovantes : KONSCIOUS : communauté interne engagée dans les enjeux écologiques, sociaux et environnementauxKAMPUS : institut de formation technique certifiéKORNER : incubateur de start-ups technologiquesKLANIK ESPORT : club professionnel e-sport ouvert aux collaborateurs
Description du poste :
Titre du poste : Ingénieur en Fiabilité de Site (SRE) - Kubernetes sur AzureL'Ingénieur en Fiabilité de Site (SRE) spécialisé en Kubernetes sur Azure sera responsable de garantir la fiabilité, l'évolutivité et la disponibilité de la flotte Kubernetes de l'entreprise sur la plateforme Azure.
Il travaillera en étroite collaboration avec les autres équipes SRE pour s'assurer que les services cloud de l'organisation respectent les objectifs de niveau de service (SLO) et les accords de niveau de service (SLA) requis.
Responsabilités principales : Concevoir, mettre en œuvre et maintenir l'infrastructure Kubernetes et ses services transversaux pour assurer une haute disponibilité, évolutivité et performance.
Mettre en place et maintenir des procédures de surveillance, d'alerte et de réponse aux incidents pour garantir une réponse rapide aux problèmes système et de service.
Développer et maintenir des scripts et des outils d'automatisation pour rationaliser les processus de déploiement et de gestion des applications conteneurisées sur Kubernetes.
Collaborer avec les autres équipes SRE pour concevoir, mettre en œuvre et maintenir des plans de reprise après sinistre et de continuité des activités.
Développer et maintenir des politiques et procédures de sécurité pour garantir la sécurité des services Kubernetes sur Azure.
Se tenir à jour des nouvelles fonctionnalités et capacités de Kubernetes sur Azure et recommander des modifications ou des mises à niveau si nécessaire.
Fournir des conseils et des formations aux autres membres de l'équipe SRE sur les meilleures pratiques et procédures Azure.
Développer et maintenir la documentation relative à l'infrastructure et aux services Kubernetes sur Azure.
Profil recherché :
Diplôme en informatique, technologies de l'information ou domaine connexe.Minimum de 5 ans d'expérience en ingénierie de fiabilité de site ou dans un rôle similaire, avec un accent sur l'infrastructure cloud sur la plateforme Azure.
Connaissance approfondie des services Kubernetes sur Azure, en particulier le calcul, le réseau et le stockage.Expérience avec les outils d'automatisation Kubernetes tels que Terraform, Helm, FluxCD ou Kustomize.
Expérience en surveillance et création de tableaux de bord (Datadog, Grafana).Excellentes compétences en résolution de problèmes et en dépannage.
Excellentes compétences en communication et en collaboration.Les certifications Microsoft Azure sont préférées.