La ROADEF
La R.O.A.D
Evénements
Prix
Publications
Plus
Forums
Connexion
Livre blanc

sujet these:Planification d'operateurs et de

Forum 'Emplois' - Sujet créé le 2005-02-16

sujet these (DGA):

contacts:
F. Dambreville, CEP, site d'Arcueil, equipe GIP
16 bis Av. Prieur de la Cote d'Or,
94114, Arcueil, cedex
tel: 01 42 31 92 96

ou J-P. Le Cadre,
IRISA/CNRS,
Campus de Beaulieu,
35042 Rennes cedex


date limite de depot du dossier (30 mars 2004)

Sujet:

Le problème de la planification optimale des capteurs et des moyens d'exploration en vue de l'établissement d'une situation tactique, est actuellement un domaine d'intérêt pour la défense.
Il s'agit ainsi de minimiser le coût ou le risque associé à la mission de renseignement.
A ce stade se présentent plusieurs difficultés:
\begin{itemize}
\item Les capteurs/moyens peuvent être nombreux (sans pour autant permettre une approximation statistique) et de natures très différentes.
Alors, il peut être difficile de formaliser de manière raisonnable le problème d'optimisation associé à cette planification,
\item L'information des capteurs peut être fusionnée ce qui permet d'envisager une qualité de l'exploration supérieure à celle obtenue par des capteurs indépendents,
\item L'information reçu fait évoluer l'\emph{a priori} au cours du temps.
Dans la planification, il faut tenir compte du fait que le recueil de certaines informations peut favoriser le déroulement de la mission d'exploration,
\item La gestion des risques liés au recueil de l'information.
On peut également envisager des mesures de protection individuelle ou collective,
\item Plusieurs niveaux de \emph{planification} peuvent être considérés, selon le niveau de contrainte temporelle, la taille du groupement de capteurs, la nature des capteurs.
En particulier si les moyens d'explorations sont constitués par des opérateurs sur le terrains, ces opérateurs doivent pouvoir gérer des replanifications à court terme imposées par l'occurence d'une situation critique (\emph{eg.} exposition au feu ennemi) avec des planifications à plus long terme associées à l'objectif d'exploration,
\item Le critère d'évaluation de la mission peut être complexe ou mal formalisé,
\item la complexité, voire les natures antagonistes des objectifs poursuivis peuvent conduire à considérer les problèmes dans un cadre d'optimisation multicritère.
\end{itemize}
Ces thématiques recoupent de nombreuses difficultés rencontrées dans d'autres domaines relatifs à l'automatisation de l'exploration, comme par exemple la robotique.
%
\paragraph{Objectifs.}
L'objet de cette thèse est d'adapter ou de développer des méthodes de planification optimale des capteurs et moyens de recherche, incluant:
\begin{itemize}
\item La gestion de capteurs multiples et de natures différentes,
\item La prise en compte de la fusion d'information,
\item La prise en compte de l'évaluation dynamique de la situation,
\item La gestion de plusieurs niveaux de \emph{planification}, liés à plusieurs niveaux d'objectifs et de contraintes.
\end{itemize}
Ces méthodes devront permettre une certaine souplesse quant à la formalisation des \emph{a priori} et des critères d'évaluation de la mission.
Dans ce cadre, il est envisagé d'utiliser de l'apprentissage sur des modèles génériques associés aux \emph{a priori}/critères mais aussi aux stratégies de planification.
Cette apprentissage devrait permettre une approximation raisonnable des \emph{a priori}\,, car il n'est évidemment pas envisagé de remonter jusqu'aux détails de chaque modèle de détection ou de fusion.
\\[2pt]
D'autre part, il est prévu que ces méthodes de planification puissent gérer des modules algorithmiques (ou humains) externes, \emph{eg.} méthodes classiques permettant de résoudre certains problèmes localisés.
\\[5pt]
Il sera envisagé la question de la gestion des risques liés au recueil de l'information.
\\[5pt]
La faisabilité pratique des algorithmes (temps de calcul) sera un facteur à prendre en compte dans la démarche.
Toutefois, nous n'envisageons pas de contrainte majeure de ce type quant à l'apprentissage.
%
\paragraph{Quelques points détaillés de la démarche.}
\subparagraph{L'étude privilégiera les techniques impliquant de l'apprentissage.}\rien\\
D'une part, il peut s'agir d'apprendre les modèles d'entrée du pro\-blème.
Ainsi, pour des données d'entrée simulées ou non, il s'agiera d'apprendre les paramètres d'un modèle d'\emph{a priori} adapté à la méthode d'optimisation choisie.
L'étude de modèles probabilistes Markoviens sera privilégiée (associés à des algorithmes d'apprentissage de type Baum-Welch ou MCMC), car ces modèles sont adaptés à un nombre important d'algorithmes d'optimisation.
Toutefois, des modèles alternatifs (par exemples des modèles flous) ne seront pas exclus de cette étude.
\\[3pt]
Dans le cas de plusieurs niveaux d'optimisation, le fonctionnement en \emph{entrée et sortie} des processus d'optimisation locaux (\emph{ie.} bas niveau) devront être pris en compte et devront donc être \emph{appris} dans le paramétrage des processus d'optimisation globaux (\emph{ie.} haut niveau): en effet, dans une telle architecture hiérarchique, les performances de l'optimisation globale dépendent des composantes locales qu'elle met en \oe uvre.
\\\\
D'autre part, il peut s'agir d'effectuer conjointement l'apprentissage des don\-nées d'entrée et de la stratégie d'optimisation.
Cet apprentissage relativement à un objectif entre dans le cadre de l'\emph{apprentissage de machine}, \emph{ie.} Machine Learning.
Nous nous baserons essentiellement sur une approche Markovienne.
Dans le cadre d'une formalisation de type POMDP (Partially Observable Markov Decision Process) du problème de planification, une première approche pourra être envisagée par des méthodes de type apprentissage par renforcement.
Toutefois nous envisageons également la mise en \oe uvre d'une méthode alternative développée au sein du département GIP, basée sur l'apprentissage optimal de modèles de stratégies génériques (il s'agit dans le cas présent de Hidden Markov Models avec entrée et sortie) au moyen de méthodes stochastiques (dans le cadre envisagé, il s'agit de méthodes d'optimisation par Cross-Entropie).
%
\paragraph{Modélisation hiérarchique.}
La notion de hiérarchie apparaît à plusieurs niveaux dans cette thématique de recherche:
\begin{itemize}
\item La planification peut se faire et même doit se faire (pour des raisons de complexité) à plusieurs niveaux, qui sont interdépendants,
\item La methode de planification peut inclure des modules algorithmiques (voire humains) externes au système.
\end{itemize}
Ces deux problématiques sont liées: une planification à plusieurs niveaux implique la prise en compte à chaque niveau des modules de planification associés au niveau inférieur.
Des travaux existent déjà sur ces questions, en particulier dans le domaine de la robotique.
Ils ont débouché sur la mise en \oe uvre de modèles Markovien hiérarchiques, les semi-HMM et les hierarchical HMM, dans le cadre de problèmes généraux de type POMDP.
Plus précisément, les modèles de semi-HMM permettent de prendre en compte des modules externes au modèle.
Les modèles HMM hiérarchiques, qui correspondent à des ``empilements'' de semi-HMM permettent de décrire des processus à plusieurs niveaux.
Le travail de thèse appliquera des modèles similaires au problème de la planification (multi-niveau) de l'exploration.