Job Description
Job Description : \n\nÀ propos de Mila et BRDG Mila est un institut de recherche de renommée mondiale en intelligence artificielle fondé par Yoshua Bengio. Reconnu mondialement pour ses importantes contributions au domaine de l'apprentissage profond, Mila s'est particulièrement distingué dans la modélisation du langage, la traduction automatique, la reconnaissance d'objets et les modèles génératifs. L'équipe BRDG (Benchmarking, Recherche et Développement pour les Grappes de calcul en IA) a pour mission d'optimiser les ressources de calcul à Mila par l'innovation technologique. Cette mission se décline en trois axes principaux : l'évaluation et le benchmarking des technologies de pointe en calcul scientifique, le développement de nouvelles méthodologies pour améliorer l'efficacité des codes de recherche, et la collaboration stratégique avec les fabricants d'accélérateurs pour influencer le développement des futures technologies et faciliter leur adoption à Mila. Nous recherchons un.e développeur.se de recherche principal.e pour rejoindre l'équipe BRDG et transformer l'efficacité computationnelle de la recherche en IA à Mila. Dans ce rôle stratégique, vous évaluerez les nouvelles architectures d'accélérateurs, collaborerez étroitement avec les équipes de recherche pour identifier les composants critiques à optimiser, et développerez des solutions d'optimisation bas niveau qui maximisent les performances de notre infrastructure de calcul de pointe. Votre expertise technique accélérera directement les découvertes scientifiques les plus critiques de notre époque en décuplant l'efficacité des ressources de calcul, ouvrant la voie plus rapidement à des percées révolutionnaires dans de nombreux domaines, notamment en médecine, science des matériaux et lutte contre les changements climatiques. Dans un contexte où le Canada élabore sa stratégie nationale pour rivaliser mondialement en calcul haute performance pour l'IA, votre travail d'optimisation et de codéveloppement avec l'industrie amplifiera considérablement le rôle stratégique de Mila, faisant de l'institut un pilier incontournable de la compétitivité technologique canadienne et démocratisant l'accès aux technologies d'IA de pointe pour les institutions du monde entier.Responsabilités principales1. Optimisation avancée et évaluation de performanceBenchmarking de nouvelles architectures : Évaluer et analyser les profils de performance des nouveaux accélérateurs de calcul pour identifier leurs caractéristiques optimales et leurs limitations.Identification de goulots d'étranglement : Analyser en profondeur des codes de recherche complexes (entraînement de modèles à grande échelle, pipelines d'inférence, algorithmes distribués) pour détecter les inefficacités computationnelles et mémorielles.Optimisations bas niveau : Implémenter des optimisations avancées incluant la réécriture de kernels personnalisés, la migration de simulations vers GPU, et l'exploitation de fonctionnalités spécialisées des accélérateurs (tensor cores, mémoire partagée, optimisations de bande passante).2. Collaborations transversalesExpertise multi-domaines : Collaborer avec des groupes de recherche spécialisés dans des domaines variés (traitement du langage naturel, vision par ordinateur, apprentissage par renforcement, réseaux de neurones graphiques) pour comprendre leurs besoins computationnels spécifiques et recommander des accélérateurs adaptés.Optimisation en cours de recherche : Collaborer étroitement avec les chercheurs pour identifier les composants computationnels stables et critiques à optimiser dans un environnement de recherche en constante évolution.Reproduction et optimisation : Reproduire fidèlement des travaux de recherche et développer des versions optimisées spécifiquement adaptées pour des accélérateurs de calcul de nouvelle génération.3. Développement logiciel et outilsBibliothèques open-source : Concevoir et implémenter des bibliothèques open-source minimale afin de partager les versions optimisées des algorithmes avec la communauté Mila et l'écosystème de recherche externe.Contribution aux benchmarks : Développer et intégrer des workflows optimisés dans la suite de benchmarks de Mila pour standardiser les meilleures pratiques de performance.4. Leadership et communicationReprésentation auprès des partenaires : Présenter l'expertise technique et les projets de recherche lors de discussions stratégiques avec des partenaires industriels potentiels.Rayonnement scientifique : Contribuer à la visibilité de l'équipe en présentant les travaux d'optimisation dans les principales conférences de machine learning et de calcul haute performance (NeurIPS, ICML, SC, etc.). Mentorat et développement d'équipe : Encadrer les développeurs de recherche juniors et contribuer activement à la structuration et à la croissance de l'équipe d'optimisation BRDG. About Mila and BRDG Mila is a world-renowned artificial intelligence research institute founded by Yoshua Bengio. Globally recognized for its significant contributions to the field of deep learning, Mila has particularly distinguished itself in language modeling, machine translation, object recognition, and generative models. The BRDG team (Benchmarking, Research and Development for AI Compute Clusters) is dedicated to optimizing computing resources at Mila through technological innovation. This mission is divided into three main areas : the evaluation and benchmarking of state-of-the-art scientific computing technologies, the development of new methodologies to improve the efficiency of research code, and strategic collaboration with accelerator manufacturers to influence the development of future technologies and facilitate their adoption at Mila. We are looking for a Principal Research Developer to join the BRDG team and transform the computational efficiency of AI research at Mila. In this strategic role, you will evaluate new accelerator architectures, collaborate closely with research teams to identify critical components for optimization, and develop low-level optimization solutions that maximize the performance of our cutting-edge computing infrastructure. Your technical expertise will directly accelerate the most critical scientific discoveries of our time by tenfold increasing the efficiency of computing resources, paving the way faster for revolutionary breakthroughs in many fields, particularly in medicine, materials science, and the fight against climate change. In a context where Canada is developing its national strategy to compete globally in high-performance computing for AI, your work on optimization and co-development with the industry will significantly amplify Mila's strategic role, making the institute an essential pillar of Canadian technological competitiveness and democratizing access to cutting-edge AI technologies for institutions worldwide. Main Responsibilities 1. Advanced Optimization and Performance EvaluationBenchmarking New Architectures : Evaluate and analyze the performance profiles of new compute accelerators to identify their optimal characteristics and limitations.Bottleneck Identification : Deeply analyze complex research code (large-scale model training, inference pipelines, distributed algorithms) to detect computational and memory inefficiencies.Low-Level Optimizations : Implement advanced optimizations including custom kernel rewriting, migration of simulations to GPU, and exploitation of specialized accelerator features (tensor cores, shared memory, bandwidth optimizations). 2. Cross-Functional CollaborationsMulti-Domain Expertise : Collaborate with research groups specializing in various fields (natural language processing, computer vision, reinforcement learning, graph neural networks) to understand their specific computational needs and recommend suitable accelerators.In-Research Optimization : Work closely with researchers to identify stable and critical computational components for optimization in a constantly evolving research environment.Reproduction and Optimization : Faithfully reproduce research work and develop optimized versions specifically adapted for next-generation compute accelerators. 3. Software Development and ToolsOpen-Source Libraries : Design and implement minimal open-source libraries to share optimized versions of algorithms with the Mila community and the external research ecosystem.Benchmark Contribution : Develop and integrate optimized workflows into the Mila benchmark suite to standardize performance best practices. 4. Leadership and CommunicationPartner Representation : Present technical expertise and research projects during strategic discussions with potential industrial partners.Scientific Outreach : Contribute to the team's visibility by presenting optimization work at major machine learning and high-performance computing conferences (NeurIPS, ICML, SC, etc.). Mentorship and Team Development : Mentor junior research developers and actively contribute to the structuring and growth of the BRDG optimization team. RequirementsCompétences et qualifications requises
Développeur.se de recherche principal.e, optimisation de performance de calcul • Montreal, QC, Canada