Th
Forum 'Emplois' - Sujet créé le 2007-06-19
-----
ALLOCATION DE RECHERCHE du ministère à compter de septembre 2007
Si vous souhaitez être candidat à cette allocation ou si vous connaissez
un candidat potentiel, merci de nous contacter (avant fin juin).
-----
Alain Berro (IRIT, Toulouse) et Anne Ruiz-Gazen (IMT, Toulouse)
berro@irit.fr ou ruiz@cict.fr
Tel : 05.61.12.86.79 ou 05.61.12.85.51
-----
Titre
« Couplage de processus informatique d'optimisation multiobjectif aux
projections révélatrices exploratoires pour des applications en économie »
Sujet
Ce sujet dont vous trouverez le détail ci-dessous se situe à
la frontière entre Statistique et Informatique.
Les décideurs qui cherchent à extraire de l'information pertinente de gros volumes de données sont souvent amenés à mettre en oeuvre des méthodes d'analyse exploratoire de données. Ces méthodes permettent de détecter et d'analyser d'éventuelles structures présentes mais cachées au sein des données comme par exemple des observations atypiques ou des groupes homogènes d'observations.
La détection de telles structures dans des ensembles de données multidimensionnels passe généralement par l'analyse de représentations graphiques obtenues par projection des données. Une méthode classique d'analyse très utilisée comme l'analyse en composantes principales consiste à chercher des projections sur des dimensions qui maximisent la dispersion des observations. Mais maximiser un critère de dispersion ne correspond pas nécessairement à la détection de structures intéressantes et l'efficacité de cette méthode a été relativisée. D'autres méthodes de projections révélatrices exploratoires (Projection Pursuit en anglais) ont ainsi vues le jour dans les années
soixante-dix. L'objectif de ces méthodes récentes consiste à définir et à calculer un indice associé à chaque direction ou espace de projection et à maximiser cet indice sur l'ensemble des directions ou espace de projection possibles. Ces directions ou espaces de projection associés à des maxima d'indice de projection sont théoriquement associés à des représentations graphiques intéressantes dans des espaces de faibles dimensions. De nombreux indices de projection on été proposés dans la littérature mais le problème d'optimisation de ces indices est toujours complexe et coûteux en temps de calcul et les solutions proposées pour maximiser ces indices ne sont pas toujours convaincantes. De fait, les méthodes de projections révélatrices sont peu utilisées et absentes des principaux logiciels de statistique.
Par ailleurs, ces dernières années ont vu l'émergence de techniques de vie artificielle imitant les processus naturels de l'évolution pour résoudre des problèmes complexes. Ces méthodes d'optimisation ou d'apprentissage permettent de résoudre des problèmes auxquels les méthodes classiques n'apportent pas de réponses satisfaisantes. Ces algorithmes dits évolutionnaires regroupent notamment les algorithmes génétiques, la programmation génétique, les systèmes de classifieurs et les stratégies d'évolution. D'autres techniques d'optimisation sont également inspirées de la théorie de l'auto-organisation dans les systèmes biologiques. Nous citerons les algorithmes de colonies de fourmis et l'optimisation pas essaim particulaire.
Ces différentes méthodes ont déjà été utilisées avec succès pour résoudre des problèmes de types différents : combinatoires ou à variables continues, avec un ou plusieurs objectif(s)... et dans des secteurs d'application très différents : optimisation d'un parcours de véhicule, rendement d'un portefeuille boursier, rationalisation de l'utilisation de ressources, amélioration des performances de
circuits électroniques...
Ces méthodes permettent également grâce à leur souplesse de programmation d'être utilisées dans un cadre d'aide à la décision, à l'analyse ou à l'observation de phénomènes ou de données par un expert (décideur, statisticien...). Mais, à notre connaissance, ces méthodes n'ont jamais été utilisées dans un contexte de projections révélatrices exploratoires et le sujet de thèse que nous proposons
consiste à utiliser des techniques de vie artificielle pour détecter d'éventuelles structures d'intérêt dans des ensembles de données volumineux et multidimensionnels.
Un des aspects originaux que nous souhaitons développer dans le cadre de cette thèse concerne la prise en compte des aspects spatiaux lorsque les données dont on dispose sont géoréférencées (on connaît la position géographique des observations). Le sujet de thèse du doctorant s'inscrit dans la lignée du travail effectué par les membres du projet de recherche SPATIALYSE de la région Midi-Pyrénées. Dans le cadre de ce projet, des chercheurs de l'équipe VORTEX ont mené des collaborations avec l'équipe Statistique-UT1 autour du thème des « dynamiques spatiales de l'économie » qui ont permis de développer des outils utiles pour la simulation, l'interaction et la visualisation pour des espaces de données de tout types et notamment des données de type économiques et environnementales. Un des thèmes forts de l'équipe Statistique UT1 est la statistique exploratoire de données et plus spécifiquement de données géoréférencées. Le présent projet arrive donc en complément notamment des é!
tudes sur les processus ponctuels proposées dans SPATIALYSE.
-----
ALLOCATION DE RECHERCHE du ministère à compter de septembre 2007
Si vous souhaitez être candidat à cette allocation ou si vous connaissez
un candidat potentiel, merci de nous contacter (avant fin juin).
-----
Alain Berro (IRIT, Toulouse) et Anne Ruiz-Gazen (IMT, Toulouse)
berro@irit.fr ou ruiz@cict.fr
Tel : 05.61.12.86.79 ou 05.61.12.85.51
-----
Titre
« Couplage de processus informatique d'optimisation multiobjectif aux
projections révélatrices exploratoires pour des applications en économie »
Sujet
Ce sujet dont vous trouverez le détail ci-dessous se situe à
la frontière entre Statistique et Informatique.
Les décideurs qui cherchent à extraire de l'information pertinente de gros volumes de données sont souvent amenés à mettre en oeuvre des méthodes d'analyse exploratoire de données. Ces méthodes permettent de détecter et d'analyser d'éventuelles structures présentes mais cachées au sein des données comme par exemple des observations atypiques ou des groupes homogènes d'observations.
La détection de telles structures dans des ensembles de données multidimensionnels passe généralement par l'analyse de représentations graphiques obtenues par projection des données. Une méthode classique d'analyse très utilisée comme l'analyse en composantes principales consiste à chercher des projections sur des dimensions qui maximisent la dispersion des observations. Mais maximiser un critère de dispersion ne correspond pas nécessairement à la détection de structures intéressantes et l'efficacité de cette méthode a été relativisée. D'autres méthodes de projections révélatrices exploratoires (Projection Pursuit en anglais) ont ainsi vues le jour dans les années
soixante-dix. L'objectif de ces méthodes récentes consiste à définir et à calculer un indice associé à chaque direction ou espace de projection et à maximiser cet indice sur l'ensemble des directions ou espace de projection possibles. Ces directions ou espaces de projection associés à des maxima d'indice de projection sont théoriquement associés à des représentations graphiques intéressantes dans des espaces de faibles dimensions. De nombreux indices de projection on été proposés dans la littérature mais le problème d'optimisation de ces indices est toujours complexe et coûteux en temps de calcul et les solutions proposées pour maximiser ces indices ne sont pas toujours convaincantes. De fait, les méthodes de projections révélatrices sont peu utilisées et absentes des principaux logiciels de statistique.
Par ailleurs, ces dernières années ont vu l'émergence de techniques de vie artificielle imitant les processus naturels de l'évolution pour résoudre des problèmes complexes. Ces méthodes d'optimisation ou d'apprentissage permettent de résoudre des problèmes auxquels les méthodes classiques n'apportent pas de réponses satisfaisantes. Ces algorithmes dits évolutionnaires regroupent notamment les algorithmes génétiques, la programmation génétique, les systèmes de classifieurs et les stratégies d'évolution. D'autres techniques d'optimisation sont également inspirées de la théorie de l'auto-organisation dans les systèmes biologiques. Nous citerons les algorithmes de colonies de fourmis et l'optimisation pas essaim particulaire.
Ces différentes méthodes ont déjà été utilisées avec succès pour résoudre des problèmes de types différents : combinatoires ou à variables continues, avec un ou plusieurs objectif(s)... et dans des secteurs d'application très différents : optimisation d'un parcours de véhicule, rendement d'un portefeuille boursier, rationalisation de l'utilisation de ressources, amélioration des performances de
circuits électroniques...
Ces méthodes permettent également grâce à leur souplesse de programmation d'être utilisées dans un cadre d'aide à la décision, à l'analyse ou à l'observation de phénomènes ou de données par un expert (décideur, statisticien...). Mais, à notre connaissance, ces méthodes n'ont jamais été utilisées dans un contexte de projections révélatrices exploratoires et le sujet de thèse que nous proposons
consiste à utiliser des techniques de vie artificielle pour détecter d'éventuelles structures d'intérêt dans des ensembles de données volumineux et multidimensionnels.
Un des aspects originaux que nous souhaitons développer dans le cadre de cette thèse concerne la prise en compte des aspects spatiaux lorsque les données dont on dispose sont géoréférencées (on connaît la position géographique des observations). Le sujet de thèse du doctorant s'inscrit dans la lignée du travail effectué par les membres du projet de recherche SPATIALYSE de la région Midi-Pyrénées. Dans le cadre de ce projet, des chercheurs de l'équipe VORTEX ont mené des collaborations avec l'équipe Statistique-UT1 autour du thème des « dynamiques spatiales de l'économie » qui ont permis de développer des outils utiles pour la simulation, l'interaction et la visualisation pour des espaces de données de tout types et notamment des données de type économiques et environnementales. Un des thèmes forts de l'équipe Statistique UT1 est la statistique exploratoire de données et plus spécifiquement de données géoréférencées. Le présent projet arrive donc en complément notamment des é!
tudes sur les processus ponctuels proposées dans SPATIALYSE.
-----