La ROADEF
La R.O.A.D
Evénements
Prix
Publications
Plus
Forums
Connexion
Livre blanc

Stage EDF R&D - Outils statistiques pour la détection d?anomalie et méthode d?ensemble

Forum 'Stages' - Sujet créé le 2022-12-07 par Cécile Rottner

Proposition de stage 2023

 

« Outils statistiques pour la détection d’anomalie et méthode d’ensemble »

 

Description :

 

Le département OSIRIS (Optimisation, SImulation, RIsques et Statistiques pour les marchés de l'énergie) de la R&D d’EDF réalise des études et des outils de calculs permettant d’assurer l’équilibre entre la production et les besoins en énergie à moindre coût et à risque maîtrisé.

 

Au sein de ce département, le groupe Gestion de Portefeuilles Moyen Terme (R35) conçoit et maintient une suite d’outils permettant d’optimiser la gestion du parc de production (Nucléaire, Hydraulique, Thermique, …) sur un horizon allant de 2 semaines à 5 ans.

 

Chacun des types d’actifs sous gestion dispose de son propre algorithme d’optimisation permettant de déterminer le coût de son activation (valeur d’usage) et d’optimiser la gestion des stocks associés (uranium, eau, …).

 

En particulier, la chaîne OPUS permet à partir d’hypothèses sur les fondamentaux du système électrique (production, consommation, marché) de fournir une vision scénarisée pour les 5 ans à venir de la production et de son empilement pour assurer l’équilibre offre-demande. Ainsi, OPUS simule l’équilibre offre-demande et produit des scénarios de coûts de l’électricité. Cette chaîne est livrée à la DOAAT (Direction Optimisation Amont Aval Trading) qui s’assure de l’équilibre physique entre l’offre et la demande en électricité au périmètre d’EDF au meilleur coût et en minimisant les risques physiques et financiers.

 

La cohérence des résultats d’OPUS est donc un enjeu stratégique pour le groupe EDF. L’objet du stage sera d’étudier des solutions statistiques permettant d’analyser à priori et à posteriori des séries temporelles afin de proposer un signal de confiance aux équipe opérationnelles utilisant la chaine de calcul.

 

Le stage se fera en collaboration avec les équipes métier de la DOAAT et éventuellement avec d’autre groupes de recherche ayant déjà travaillé sur des questions d’analyse d’anomalies via machine learning.

 

Une piste prometteuse pourrait être l’application de l’isolation Forest qui semble particulièrement adapté à l’analyse de série temporelles complexes.

 

Par ailleurs, il est envisagé d’utiliser différentes méthodes de caractérisation du caractère cohérent ou non des données d’entrée et d’utiliser un classifier du type Ensemble Method en fin de processus en affectant un poids à chacune des prédictions.

 

On propose de décomposer la mission du stage de la manière suivante :

 

  1. Prise en main de la chaine OPUS, étude des distributions historiques des variables d’entrée et identification des horizons pertinents pour la détermination des intervalles de confiance

 

  1. Déterminer quelle(s) distance(s) utiliser pour calculer un écart historique entre les séries temporelles

 

  1. Revue bibliographique des méthodes d’identification d’anomalies via machine learning (cf références)

 

  1. Mise en place d’une maquette (python ou c++, à définir) implémentant les méthodes retenues

 

Références :

 

Staerman, G., Mozharovskyi, P., Clémençon, S., & d’Alché-Buc, F. (2019, October). Functional isolation forest. In Asian Conference on Machine Learning (pp. 332-347). PMLR

 

Zhao, Z., Mehrotra, K. G., & Mohan, C. K. (2015, June). Ensemble algorithms for unsupervised anomaly detection. In International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems (pp. 514-525). Springer, Cham

 

Conditions matérielles :

 

Le stagiaire sera co-encadré par le groupe R35.

Lieu du stage : EDF Lab, 7 Boulevard Gaspard Monge 91120 Palaiseau.

Le site est accessible par transports en commun.

Durée : 6 mois

Rémunération : en fonction du niveau d’étude et de la formation préparée.

Profil : Troisième année d’école d’ingénieur / Master 2 en mathématiques appliquées/machine learning.

Compétences : optimisation, statistiques, probabilités, séries temporelles, informatique (Python/C++)

 

Encadrants du Groupe R35

Blandine BLOMME : blandine.blomme@edf.fr

Arthur Lavergne : arthur.lavergne@edf.fr