La ROADEF
La R.O.A.D
Evénements
Prix
Publications
Plus
Forums
Connexion
Livre blanc

sujet master de recherche a EDF R&D en optimisation

Forum 'Emplois' - Sujet créé le 2008-01-03

Optimisation de stratégies de maintenance et d'exploitation pour le parc nucléaire par programmation dynamique neuronale

Contexte
La gestion sûre et rentable, sur une durée d'exploitation d'au moins 40 ans, de son parc nucléaire, est une problématique fondamentale pour l'exploitant EDF.
Les incertitudes qui pèsent sur l'outil de production et sur son contexte d'exploitation sont nombreuses (vieillissement des composants, évolutions réglementaires, évolutions climatiques, etc.). Ainsi, dès 2001, EDF a lancé un projet de recherche visant développer des méthodes et outils d'aide à la décision en univers incertain afin de permettre à ses décideurs d'évaluer (d'un point de vue technico-économique) et de comparer des stratégies de maintenance et d'exploitation, pour une durée d'exploitation cible.
Ces évaluations se basent sur le calcul d'indicateurs technico-économiques (avec les incertitudes associées) aptes à éclairer les décideurs.
Afin de réaliser ces évaluations, EDF-R&D a développé le logiciel EDEN qui repose sur la simulation probabiliste des vies possibles d'une centrale, pour une stratégie d'exploitation et de maintenance donnée.

Objectif
Les stratégies, qui définissent les actions préventives et/ou correctrices qui feront face aux risques identifiés sur les composants de la centrale, sont à l'heure actuelle une donnée d'entrée des évaluations réalisées avec EDEN (elles sont établies par les experts du domaine). L'objectif du stage est de concevoir et de mettre en œuvre un algorithme permettant de déterminer la stratégie optimale, suivant un critère de performance donné (espérance du productible, Valeur Actuelle Nette de la centrale de production en fin d'exploitation, ...).

Cadre de l'optimisation
Dans EDEN la centrale est modélisée comme un ensemble de composants, dotés chacun de variables d'états. Chacune de ces composants a une évolution aléatoire, régies – via l'occurrence des risques qui leur sont associés – par les lois de probabilités dépendant de l'état courant du système, d'évènements extérieurs et aussi des actions de maintenance préventive et corrective.
La centrale peut donc être considérée comme un système dynamique stochastique, qu'on peut influencer via des actions de maintenance préventive et/ou corrective (décisions de commande).
Cependant, la complexité du système (qui peut, en effet, prendre grand nombre d'états) rend difficile – voire impossible – l'explicitation, a priori, du processus aléatoire sous-jacent.

Il s'agit, dans le cadre de ce stage, de chercher la commande optimale de ce système dans le cadre général de la programmation dynamique neuronale, tel que décrit par Bertsekas dans [1].
D'une part, on cherchera une méthode basée sur la simulation, s'intégrant au processus de Monte-Carlo d'EDEN pour mettre à jour itérativement les paramètres de valeurs/politiques optimaux.
D'autre part, des stratégies d'approximation devront être envisagées (intégration d'heuristiques, approximation par réseaux de neurones,...) pour maintenir des temps de calcul raisonnables

Plan de déroulement
L'objectif final d'optimisation est assez ambitieux. Ce stage constitue donc une première analyse du problème et s'inscrira dans une démarche progressive :

1. prise en main d'eden et des concepts de modélisation sous-jacents
2. formalisation du problème d'optimisation
3. bibliographie sur la programmation dynamique neuronale / apprentissage par renforcement
4. propositions de plusieurs approches de résolutions
5. choix et implémentation d'une approche sur une instance réduite du problème
6. analyse des résultats et perspectives pour une généralisation
7. rédaction du mémoire du stage

A l'issue du stage, et en fonction des résultats obtenues et de l'intérêt des perspectives identifiées, une thèse sur le sujet pourra être envisagée.

Compétences mises en œuvre
· programmation objet (Java)
· probabilités et statistiques
· commande optimale/ programmation dynamique
· méthodes d'approximation et d'apprentissage

Profil recherché
Etudiant de mastère de recherche (intelligence artificielle, sciences cognitives, recherche opérationnelle, optimisation,..).

Références
[1] Bertsekas, Tsitsiklis, « Neuro-Dynamic Programming » (1996)
[2] Sutton, Barto, "Reinforcement Learning: An Introduction" (1998)

Encadrants, dates et lieu du stage
Le stage aura lieu dans le centre de recherche EDF de Chatou (78, région parisienne), au sein de l'équipe « Systèmes Dynamiques et Traitement d l'Information ».
Il sera encadré par trois chercheurs EDF :
· Philippe Haïk (phillipe.haik@edf.fr)
· Serge Maurin (serge.maurin@edf.fr)
· Christian Mondon (christian.mondon@edf.fr)

Le stage se déroulera pendant l'année 2008 (en fonction du calendrier du mastère).