Talent.com
Scientific Games
Tech Ops EngineerScientific Games • Montreal, Quebec
Tech Ops Engineer

Tech Ops Engineer

Scientific Games • Montreal, Quebec
14 days ago
Job type
  • Full-time
Job description

Description du poste

L'ingénieur en opérations techniques assure le soutien de niveau 2 pour la production, le soutien à la mise en œuvre et l'ingénierie de la fiabilité des plateformes de loterie et de services interactifs. Ce poste garantit des opérations stables, sécurisées, observables et bien documentées dans des environnements Linux, Windows, de bases de données, d'applications, de réseau et adaptés au cloud.

Ce profil modernisé met l'accent sur les pratiques DevOps et de fiabilité des sites : opérations axées sur l'automatisation, prise en charge des déploiements CI/CD, infrastructure en tant que code, déploiements contrôlés, observabilité, gestion des incidents, gestion de la configuration, hygiène de sécurité, ainsi que les opérations sur AWS ou en cloud hybride, le cas échéant.

Ce poste peut être comblé à Montréal et/ou à Winnipeg, selon les besoins de l’organisation et le lieu de résidence des candidats retenus.

Responsabilités clés

  • Assurer le soutien technique de niveau 2 pour les plateformes de transactions en temps réel, notamment le triage des incidents, le dépannage et la coordination des escalades avec le niveau 3, le développement, l'assurance qualité, les fournisseurs et les opérations client.

  • Assurer le soutien des opérations de garde 24 heures sur 24, 7 jours sur 7, des fenêtres de maintenance planifiée, des nouvelles mises en œuvre, des refontes de systèmes, de l'analyse des performances, des tests d'intégration, des tests de reprise après sinistre et des activités de basculement sur place.

  • Installer, configurer, appliquer des correctifs, sécuriser et gérer le cycle de vie des serveurs Linux et Windows, en mettant l'accent sur les environnements Ubuntu LTS et Red Hat Enterprise Linux (RHEL).

  • Automatisez les tâches opérationnelles à l'aide de Bash, Python, PowerShell, Ansible, Terraform, SQL, CloudFormation ou d'outils équivalents afin de réduire les tâches manuelles, d'uniformiser les environnements et d'améliorer la fiabilité.

  • Prise en charge des opérations sur AWS ou en cloud hybride, le cas échéant, notamment EC2, RDS/Aurora PostgreSQL, S3, IAM, VPC, les groupes de sécurité, les équilibreurs de charge, Route 53, CloudWatch, Systems Manager, KMS et Secrets Manager.

  • Soutenir les activités liées à l'intégration continue et au déploiement continu (CI/CD) ainsi qu'à l'ingénierie des versions, notamment la préparation au déploiement, la validation des builds et des paquets, la mise en place des configurations, les concepts « blue/green » ou « canary », la planification des retours en arrière et la vérification post-déploiement.

  • Surveiller l'état des systèmes et des bases de données, l'utilisation des serveurs, les certificats, le flux des transactions, les files d'attente et les retards, les journaux, les indicateurs de performance du nuage et la disponibilité des services ; gérer les tableaux de bord, les alertes, les guides d'intervention et les procédures.

  • Effectuer des tâches de soutien liées à PostgreSQL/Postgres et aux SGBDR, telles que l'analyse des requêtes, la coordination des sauvegardes et des restaurations, le soutien à l'actualisation des données, le dépannage des connexions, l'évaluation de la capacité et la collecte de preuves.

  • Assurer la sécurité et l'hygiène opérationnelle grâce à l'application de correctifs, la correction des vulnérabilités, la gestion des certificats SSL/TLS, le principe du moindre privilège, la configuration sécurisée, les concepts de chiffrement et la mise à disposition de preuves d'audit.

  • Analyser les causes racines des problèmes de performance, des échecs de transaction, des anomalies de déploiement, des problèmes liés au nuage, au réseau ou aux serveurs, ainsi que des incidents récurrents ; communiquer les détails techniques et les mesures correctives.

Exigences du poste / Qualifications requises

  • Diplôme d'études collégiales dans un domaine connexe requis ; diplôme de premier cycle en informatique, en technologies de l'information, en génie ou dans un domaine connexe, un atout.

  • Au moins 5 ans d'expérience dans le soutien opérationnel, le DevOps, l'infrastructure, le soutien à la production, les opérations dans le nuage ou l'ingénierie de la fiabilité pour des plateformes transactionnelles à l'échelle de l'entreprise.

  • Une expérience dans les domaines des loteries, des jeux d'argent, des services financiers, du commerce électronique ou d'autres environnements transactionnels réglementés et à haute disponibilité constitue un atout majeur.

  • Maîtrise de l'administration de Windows Server et de Linux, en particulier Ubuntu LTS et Red Hat Enterprise Linux, notamment en matière de dépannage, d'application de correctifs, de renforcement de la sécurité et d'analyse des performances.

  • Connaissance de PostgreSQL/Postgres, RDS/Aurora PostgreSQL, SQL Server, MySQL, Oracle ou d’autres bases de données relationnelles similaires, y compris les concepts liés au dépannage SQL et à la maintenance opérationnelle.

  • Maîtrise de Python, Bash, PowerShell, SQL, Ansible, Terraform, CloudFormation ou d'outils similaires pour la création de scripting, le débogage, l'automatisation et la collecte de preuves.

  • Une expérience avec AWS est un atout, notamment avec EC2, RDS/Aurora, S3, IAM, VPC/groupes de sécurité, CloudWatch, Systems Manager, KMS, Secrets Manager, Route 53, l'équilibrage de charge, les instantanés, ainsi que les concepts de haute disponibilité (HA) et de reprise après sinistre (DR).

  • Expérience en virtualisation, stockage, réseaux, certificats SSL/TLS, gestion des identités et des accès (IAM), sécurité des systèmes, outils de surveillance et d’observabilité, intégration continue et déploiement continu (CI/CD), ainsi que gestion des changements en production.

Compétences et aptitudes

  • Solides compétences en analyse et en dépannage, avec la capacité d'identifier les problèmes au niveau des applications, des bases de données, du système d'exploitation, du réseau, du stockage, de la gestion des identités et des accès (IAM), des services en nuage et des pipelines de déploiement.

  • Une communication claire, tant à l'oral qu'à l'écrit, comprenant notamment des mises à jour concises sur l'état d'avancement, des notes d'incident, des guides d'intervention, des preuves de modification et de la documentation technique destinés à des publics tant opérationnels que techniques.

  • Un esprit de collaboration et la capacité de travailler en partenariat avec les équipes des opérations, du développement, de l'assurance qualité, des fournisseurs, de la sécurité et celles en contact direct avec la clientèle.

  • Une culture d'amélioration continue axée sur l'automatisation, la normalisation, la fiabilité, la sécurité, l'observabilité, la préparation au cloud et l'excellence opérationnelle.

  • Capacité avérée à diagnostiquer et à résoudre des problèmes techniques dans des environnements soumis à une forte pression et ayant un impact sur les clients, tout en respectant les procédures de gestion des changements et en garantissant la traçabilité.

  • Être à l'aise pour travailler au sein d'une équipe répartie sur plusieurs sites géographiques et pour expliquer des concepts techniques complexes à des intervenants non spécialisés.

Conditions de travail

  • Participe à un système de rotation des gardes 24 heures sur 24, 7 jours sur 7, et assure un soutien en dehors des heures normales de travail pour les incidents, les mises en production, les fenêtres de maintenance, les tests de reprise après sinistre et les engagements envers les clients.

  • Peut fournir un soutien sur place lors des déploiements, des migrations, des tests de reprise après sinistre, des transitions vers le nuage ou les environnements hybrides, ainsi que lors des refontes de systèmes.

  • Peut être amené à voyager au besoin pour apporter son soutien aux administrations chargées des loteries, lors d'événements liés à la mise en œuvre ou pour assurer la coordination avec les clients et les fournisseurs.

Environnement technique et outillage

Systèmes d'exploitation

Ubuntu LTS, Red Hat Enterprise Linux (RHEL), Windows Server ; systemd, application de correctifs, renforcement de la sécurité, analyse des logs, capacité et performance

Bases de données

PostgreSQL/Postgres, concepts de RDS/Aurora PostgreSQL, SQL Server, MySQL, Oracle ; dépannage des requêtes, sauvegardes/restaurations, réplication et concepts liés à la capacité

Automatisation / Scripting

Python, Bash, PowerShell, SQL ; playbooks Ansible, modules Terraform, modèles CloudFormation, API, automatisation des runbooks et outils opérationnels

DevOps / CI-CD

Git, pipelines CI/CD, promotion d'artefacts/de paquets, portes de validation, validation du déploiement, concepts bleu/vert/canari, planification des rollback et collecte de preuves

AWS / Cloud

Connaissances souhaitées : EC2, RDS/Aurora, S3, IAM, VPC, groupes de sécurité, équilibreurs de charge, Route 53, CloudWatch, Systems Manager, KMS, Secrets Manager, instantanés et concepts de haute disponibilité

Conteneurs / Plateforme

Connaissance des concepts Docker et Kubernetes ; une bonne maîtrise d'ECS/EKS est un atout ; découverte de services ; variables d'environnement/secrets et modèles d'infrastructure immuable

Observabilité

CloudWatch, Prometheus, Grafana, Splunk, ELK/OpenSearch ou leurs équivalents ; logs, métriques, traces, tableaux de bord, configuration des alertes et rapports sur les SLO/SLA

Sécurité / Infrastructure

IAM/principe du privilège minimal, certificats SSL/TLS, correction des vulnérabilités, réseaux, stockage, virtualisation, sauvegardes, reprise après sinistre, chiffrement, preuves d'audit et contrôle des changements

____________________________________________________________________________________________________________________________________________________________

Job Description

The Tech Ops Engineer provides Tier 2 production support, implementation support, and reliability engineering for lottery and interactive service platforms. This role ensures stable, secure, observable, and well-documented operations across Linux, Windows, database, application, network, and cloud-aware environments.

The modernized profile emphasizes DevOps and Site Reliability practices: automation-first operations, CI/CD release support, infrastructure as code, controlled deployments, observability, incident response, configuration management, security hygiene, and AWS or hybrid-cloud operations where applicable.

This position may be filled in Montreal and/or Winnipeg, based on organizational needs and the province of origin of the candidates.

Key Responsibilities

  • Provide Tier 2 production support for real-time transaction platforms, including incident triage, troubleshooting, and escalation coordination with Tier 3, Development, QA, vendors, and customer operations.

  • Support 24x7 on-call operations, planned maintenance windows, new implementations, system overhauls, performance analysis, integration testing, DR tests, and on-site cutover activities.

  • Install, configure, patch, harden, and lifecycle-manage Linux and Windows servers, with emphasis on Ubuntu LTS and Red Hat Enterprise Linux (RHEL) environments.

  • Automate operational tasks using Bash, Python, PowerShell, Ansible, Terraform, SQL, CloudFormation, or equivalent tools to reduce manual effort, standardize environments, and improve reliability.

  • Support AWS or hybrid-cloud operations where applicable, including EC2, RDS/Aurora PostgreSQL, S3, IAM, VPC, security groups, load balancers, Route 53, CloudWatch, Systems Manager, KMS, and Secrets Manager.

  • Support CI/CD and release engineering activities, including deployment readiness, build/package validation, configuration promotion, blue/green or canary concepts, rollback planning, and post-release verification.

  • Monitor system/database health, server utilization, certificates, transaction flow, queues/backlogs, logs, cloud metrics, and service availability; maintain dashboards, alerts, runbooks, and procedures.

  • Perform PostgreSQL/Postgres and RDBMS support tasks such as query analysis, backup/restore coordination, data refresh support, connection troubleshooting, capacity review, and evidence collection.

  • Maintain security and operational hygiene through patching, vulnerability remediation, SSL/TLS certificate management, least-privilege access, secure configuration, encryption concepts, and audit evidence support.

  • Investigate root causes for performance issues, transaction failures, deployment anomalies, cloud/network/server problems, and recurring incidents; communicate technical details and corrective actions.

Position Requirements / Qualifications

  • Associate degree in a related field required; bachelor degree in Computer Science, Information Technology, Engineering, or a related field preferred.

  • Minimum 5 years of experience in operations support, DevOps, infrastructure, production support, cloud operations, or reliability engineering for enterprise-scale transactional platforms.

  • Experience in lottery, gaming, financial services, e-commerce, or other regulated, high-availability transaction environments is a strong asset.

  • Proficient with Windows Server and Linux administration, especially Ubuntu LTS and Red Hat Enterprise Linux, including troubleshooting, patching, hardening, and performance analysis.

  • Familiarity with PostgreSQL/Postgres, RDS/Aurora PostgreSQL, SQL Server, MySQL, Oracle, or similar relational databases, including SQL troubleshooting and operational maintenance concepts.

  • Competence in Python, Bash, PowerShell, SQL, Ansible, Terraform, CloudFormation, or similar tools for scripting, debugging, automation, and evidence collection.

  • AWS experience is beneficial, particularly EC2, RDS/Aurora, S3, IAM, VPC/security groups, CloudWatch, Systems Manager, KMS, Secrets Manager, Route 53, load balancing, snapshots, HA and DR concepts.

  • Experience with virtualization, storage, networking, SSL/TLS certificates, IAM, system security, monitoring/observability tools, CI/CD, and production change control.

Skills and Competencies

  • Strong analytical troubleshooting skills with the ability to isolate issues across application, database, operating system, network, storage, IAM, cloud-service, and deployment pipeline layers.

  • Clear verbal and written communication, including concise status updates, incident notes, runbooks, change evidence, and technical documentation for business and technical audiences.

  • Collaborative working style with the ability to partner with Operations, Development, QA, vendors, security, and customer-facing teams.

  • Continuous improvement mindset focused on automation, standardization, reliability, security, observability, cloud readiness, and operational excellence.

  • Proven ability to diagnose and resolve technical issues in high-pressure, customer-impacting environments while maintaining change discipline and auditability.

  • Comfortable working within a distributed team across multiple geographic locations and explaining complex technical concepts to non-technical stakeholders.

Working Conditions

  • Participates in 24x7 on-call rotation and provides after-hours support for incidents, releases, maintenance windows, DR tests, and customer commitments.

  • May provide on-site support during implementations, conversions, disaster recovery tests, cloud/hybrid changes, and system overhauls.

  • May travel as needed to support lottery jurisdictions, implementation events, or customer/vendor coordination.

Technical Environment and Tooling

Operating Systems

Ubuntu LTS, Red Hat Enterprise Linux (RHEL), Windows Server; systemd, patching, hardening, log analysis, capacity and performance

Databases

PostgreSQL/Postgres, RDS/Aurora PostgreSQL concepts, SQL Server, MySQL, Oracle; query troubleshooting, backups/restores, replication and capacity concepts

Automation / Scripting

Python, Bash, PowerShell, SQL; Ansible playbooks, Terraform modules, CloudFormation templates, APIs, runbook automation and operational tooling

DevOps / CI-CD

Git, CI/CD pipelines, artifact/package promotion, release gates, deployment validation, blue/green/canary concepts, rollback planning and evidence collection

AWS / Cloud

Beneficial: EC2, RDS/Aurora, S3, IAM, VPC, security groups, load balancers, Route 53, CloudWatch, Systems Manager, KMS, Secrets Manager, snapshots and HA concepts

Containers / Platform

Docker, Kubernetes concepts, ECS/EKS familiarity beneficial, service discovery, environment variables/secrets and immutable infrastructure patterns

Observability

CloudWatch, Prometheus, Grafana, Splunk, ELK/OpenSearch or equivalents; logs, metrics, traces, dashboards, alert tuning and SLO/SLA reporting

Security / Infrastructure

IAM/least privilege, SSL/TLS certificates, vulnerability remediation, networking, storage, virtualization, backups, DR, encryption, audit evidence and change control

Create a job alert for this search

Tech Ops Engineer • Montreal, Quebec

Similar jobs

Onsite IT Operations Support Engineer (Montreal)

Hitachi VantaraMontreal (administrative region), QC, CA
Full-time

Join as an Onsite IT Operations Support Engineer, directly influencing user experience through effective IT service.Deliver hands‑on assistance in a manufacturing environment.In your role at Varenn... Show more

 • Promoted

Senior IT Ops Specialist [#4930]

AlteoMontreal (administrative region), QC, CA
Permanent

Senior IT Ops Specialist (English).Alteo is looking for a Senior IT Ops Specialist for a permanent position based in Montreal.Your main role will be to contribute to the smooth running and optimiza... Show more

 • Promoted

Technical Implementation Engineer II

Landis+GyrLongueuil, Montérégie, CA
Full-time

The Technical Implementation Engineer II serves as an escalation point for technical issues that are complex in nature which are escalated from the program support teams as well as internal teams.T... Show more

 • Promoted

Engineer Co-Op In Wireless Sensing Technologies

Huawei CanadaRivière-Des-Prairies-Pointe-Aux-Trembles, Canada
Full-time

Step into a Co-op position as an Engineer at Huawei Canada, specializing in wireless sensing technologies.This role emphasizes data collection and performance evaluation within a vibrant R&D la... Show more

 • Promoted

Cloud Operations Developer

Empire LifeMontreal (administrative region), QC, CA
Full-time

Location: Remote - Anywhere in Canada.Empire Life is looking to hire a Cloud Operations Developer to join our IT Infrastructure & Operations team.The base salary will be determined by the successfu... Show more

 • Promoted

DevOps Engineer - AWS, CI/CD & Reliability Focus

NewtonMontreal (administrative region), QC, CA
Full-time

A leading cryptocurrency firm in Canada is seeking a DevOps Engineer to improve CI/CD workflows and manage infrastructure.The ideal candidate will have experience with AWS, automation, and operatio... Show more

 • Promoted

Remote Platform Engineer — Cloud & Kubernetes Ops

PlanetMontreal (administrative region), QC, CA
Remote
Full-time

A leading global space and data company is seeking a Software Engineer in Platform Operations.This full-time remote role prioritizes building and operating cloud infrastructure supporting engineeri... Show more

 • Promoted

Innovative AI Developer Co-op for Nuclear Efficiency Projects

Nuclear Promise XMontreal (administrative region), QC, CA
Full-time

Be a part of revolutionizing nuclear operations as an AI Developer Co-op.Design, develop, and deploy AI agents to enhance efficiency and safety remotely from Ontario.This role entails taking owners... Show more

 • Promoted

AWS DevOps Engineer - Remote Position

Framework VenturesMontreal (administrative region), QC, CA
Remote
Full-time

Embark on a journey to enhance DevOps practices as a remote DevOps Engineer.You will be integral in streamlining deployment processes and boosting the performance of AWS-based systems.This role dem... Show more

 • Promoted

Technical Onboarding & DataOps Lead

AntlerMontreal (administrative region), QC, CA
Full-time

A tech startup is seeking a Technical Customer Success Manager responsible for leading the onboarding experience and ensuring long-term customer success.This role involves hands-on work with produc... Show more

 • Promoted

Technical Engineer for Imaging Solutions

UnitedHealth GroupMontreal (administrative region), QC, CA
Full-time

Become a Technical Engineer focused on imaging solutions.Deliver top-notch remote support for PACS and cloud systems, ensuring issues are swiftly resolved to enhance healthcare delivery.This positi... Show more

 • Promoted

Cloud Observability Engineer

TMCMontreal (administrative region), QC, CA
Permanent

We are seeking an experienced and motivated engineer to join the Observability fleet which focuses on delivering tools in private and public cloud environments.The role focuses on developing and mo... Show more

 • Promoted

Forward Deployed Engineer, Agentic Platform (UK/Europe)

Jaide HealthMontreal (administrative region), QC, CA
Full-time

Toronto, Ottawa, Montreal, Canada.Our mission is to scale intelligence to serve humanity.We’re training and deploying frontier models for developers and enterprises who are building AI systems to p... Show more

 • Promoted

Cloud DevOps Engineer (Azure)

Onico SolutionsMontreal (administrative region), QC, CA
Temporary

We are currently looking for an experienced Cloud DevOps Engineer (Azure) with hands on experience developing automation and modernizing applications in Cloud native architecture.Gather and analyze... Show more

 • Promoted

DevOps Engineer

Millennium Software and Staffing IncMontreal (administrative region), QC, CA
Full-time

Millennium Software and Staffing | Lean Six Sigma Green Belt.NET framework & data warehouse automation.Scripting (Python/Perl/Shell – nice to have).Strong problem‑solving & collaboration skills.Ref... Show more

 • Promoted

T&M - Telco Cloud Openshift System Engineer

MANNARINOMontreal (administrative region), QC, CA
Full-time

Career Opportunity and Primary Roles / Responsibilities.Deploy and manage production‑grade OpenShift clusters (4.Create and maintain Helm charts and Operators for DU/CU micro‑services.Implement and... Show more

 • Promoted

Remote DevOps Engineer: AWS, Kubernetes & CI/CD

HRBMontreal (administrative region), QC, CA
Remote
Full-time

An innovative trading fund is seeking a skilled DevOps Engineer to join their remote team.In this role, you will implement cutting-edge infrastructure projects, design secure automation solutions, ... Show more

 • Promoted

Senior DevOps Engineer - AWS (Remote)

LumenaltaMontreal (administrative region), QC, CA
Remote
Full-time

At Lumenalta, we create impactful software solutions that drive innovation and transform businesses.Since 2000, we’ve partnered with visionary leaders to build cutting‑edge tech, solve complex chal... Show more

 • Promoted

Remote Ops Architect Large-Scale Optimization

KinaxisMontreal (administrative region), QC, CA
Remote
Full-time

A leading supply chain management company in Canada is seeking an Operations Research Architect to innovate optimization and algorithmic capabilities.You will guide the development of complex mathe... Show more

 • Promoted

OT Business Development Engineer East

FortinetMontreal (administrative region), QC, CA
Full-time

Join Fortinet, a cybersecurity pioneer with over two decades of excellence, as we continue to shape the future of cybersecurity and redefine the intersection of networking and security.At Fortinet,... Show more