Stage - Utilisation d’IA pour l’analyse d’incidents opérationnels - H/F

L'entreprise

Au cœur des enjeux de la planète, CLS, Tech4Good company, filiale du CNES et de la CNP, est une société à mission internationale, pionnière dans la fourniture de solutions d’observation et de surveillance de la Terre.

Opérateur historique des balises Argos, CLS, depuis 1986, avec plus de 900 salariés dans 30 pays et un chiffre d’affaires annuel de près de 170 millions d’euros, figure parmi les spécialistes des services satellitaires en utilisant les technologies spatiales les plus avancées, couplées au génie logiciel et à la data-sciences.

Tu souhaites rejoindre des équipes agiles et dynamiques sur des projets innovants et ambitieux ? Explorer de nouvelles technologies ? Evoluer sur des projets transverses et variés autour des 5 secteurs d’activité de CLS ?

L’équipe du Pole Opérations de la Direction Systèmes d'Informations de CLS, recherche un(e) stagiaire pour évoluer et développer ses compétences autour du sujet suivant :

« Utilisation d’IA pour l’analyse d’incidents opérationnels »

Le poste

Dans le cadre de ses services 24/7, CLS gère des systèmes critiques nécessitant une surveillance opérationnelle continue. L’objectif est de maintenir une haute disponibilité en identifiant rapidement les incidents, d’en déterminer l’origine et d’améliorer ainsi la résilience du système. Le produit Grafana comprend un outil de machine learning spécialisé dans la détection automatique d’incidents et l’identification de ses origines, permettant ainsi d’optimiser la gestion des incidents dans des environnements complexes.  

Tes missions si tu nous rejoins :

  • Paramétrer Grafana afin de détecter automatiquement les anomalies et incidents dans certains systèmes critiques,
  • Mettre en place des dashboards Grafana pour la visualisation de ces incidents détectés et des alertes en temps réel,
  • Proposer et tester des solutions permettant la remontée des alertes Grafana sur un système centralisé (type Nagios) ,
  • Analyser les incidents identifiés par Grafana et remonter à l’origine afin de prévenir des incidents futurs,
  • Collaborer avec les opérateurs, les ingénieurs d’exploitation et les ingénieurs IT pour optimiser la gestion des incidents et assurer la coordination dans un environnement à haute disponibilité,
  • Proposer des améliorations dans la configuration de Grafana pour affiner les prédictions et les détections d’anomalies.  

L’environnement technique que nous utilisons : Grafana, Python, Git, Nagios, DevOps (Kubernetes, Docker), Systèmes de gestion de logs (OpenSearch/ELK, Prometheus).  

 

Profil recherché

Etudiant(e) en Informatique, tu souhaites développer tes compétences et tes connaissances en IA.

Compétences requises :

  • Compétences en monitoring de systèmes et en haute disponibilité.  
  • Connaissance des outils de visualisation de données, en particulier Grafana. 
  • Compréhension de l’utilisation d’outils de machine learning et d’intelligence artificielle pour la détection d’anomalies. 

Une bonne maîtrise de l’administration système, des infrastructures IT et des environnements critiques est indispensable pour mener à bien ta mission.

L’ouverture d’esprit, l’aisance relationnelle, la flexibilité, l’autonomie, la curiosité et l’esprit d’analyse sont attendus.

Tu aimes les challenges, tu as l’esprit d’équipe, alors, demain avec l’ensemble des équipes de CLS, nous rendrons nos systèmes plus efficients et utilisés par le plus grand nombre, viens rejoindre l’aventure !

 

Éléments nécessaires pour postuler

Pour valider votre candidature, nous vous demandons de fournir les éléments suivants, vous devrez télécharger les pièces demandées directement lors de votre inscription.

Toute candidature incomplète ne sera pas traitée par nos services.

Document(s) :

  • Curriculum Vitæ
  • Lettre de motivation

Candidature facile