03/02/2026 –, Monet
À l’INSEE, nous utilisons des méthodes statistiques variées pour mieux comprendre et analyser les données. Comme ces méthodes partagent beaucoup de points communs avec le machine learning, il nous a semblé naturel d’explorer ces techniques. Nous avons ainsi commencé à les tester pour automatiser certaines tâches, comme la codification des professions (code PCS) ou encore des activités des entreprises (code NAF).
La mise en production s’est heurtée à un obstacle bien connu : un fort cloisonnement entre les équipes métiers et la DSI, avec des cultures, des outils et des priorités différentes. C'est dans ce contexte que le MLOps, la rencontre entre le DevOps et le Machine learning s'impose comme un paradigme incontournable afin de rapprocher data scientists et développeurs.
Cette présentation proposera une vision croisée métier et technique, avec l’intervention conjointe d’un data scientist et d’un architecte. Du recueil du besoin à l’automatisation de bout en bout sur Kubernetes (entraînement, packaging, monitoring), en passant par la gouvernance du code et des modèles, nous partagerons comment nous avons franchi le cap du prototype à la production. Nous aborderons notamment :
- Organisation et culture : comment instaurer un langage commun, former et aligner les équipes dans une administration.
- Fondations techniques : de la plateforme de R&D à l'automatisation de l'entraînement, en passant par la gouvernance des modèles et du code.
- Mise à disposition des modèles dans une architecture multicluster : la maîtrise des flux est essentielle pour assurer sécurité et performance.
- Pattern de déploiements : méthodes et bonnes pratiques pour livrer des modèles de manière fiable et sécurisée.
A travers cette intervention, les participantes et participants repartiront avec :
- une compréhension claire des enjeux du MLOps et de sa valeur ajoutée dans un contexte réel,
- des bonnes pratiques et des outils cloud-native transposables,
- des pistes concrètes pour évaluer la maturité MLOps de leur propre organisation.
En somme, un retour d’expérience sur la transformation de prototypes isolés en une chaîne MLOps industrielle, sécurisée et pérenne, portée par des outils standards et cloud native.
En tant qu’architecte applicatif au sein de l’INSEE, j’accompagne au quotidien les équipes de développement et de production afin d’améliorer leur SI. Mon objectif est d’encourager l’innovation tout en garantissant un cadre et une sécurité opérationnelle optimale. Cet objectif me pousse à réaliser une veille continuelle sur divers sujets techniques afin de proposer les solutions les plus adaptées.
Data scientist de formation, je suis d'autant plus impliqué dans les sujets liés à la mise en production de solutions d'IA.
Linkedin : https://fr.linkedin.com/in/hugo-simon-53ba171bb
Medium : https://medium.com/@simon.hugo59
En tant que Data Scientist à la direction des statistiques d'entreprises de l’Insee, je pilote le répertoire Sirene et son système de codification automatique de l’APE. J’assure la rédaction des spécifications métiers et la prise en charge du pipeline complet de ML, en coordination étroite avec l’équipe informatique pour le déploiement en production. Mon objectif est d’améliorer l’intégration des modèles IA dans le SI : industrialiser les solutions, garantir reproductibilité et conformité aux contraintes métiers, et favoriser l’adoption du MLOps au sein de l’administration. Par ailleurs, je mène une veille active sur les projets IA open source pour proposer des solutions opérationnelles et adaptées.