Méthodes algorithmiques pour l’analyse de données complexes et de grande dimension
- Imprimer
- Partager
- Partager sur Facebook
- Share on X
- Partager sur LinkedIn
Projet exploratoire
Description scientifique du projet
L'objectif du projet de recherche Persyvact est de construire des outils d'analyse de modèles hiérarchiquement structurés pour des données complexes de haute dimension. Les outils proposés par Persyvact sont basés sur des développements mathématiques et algorithmiques de pointe. Une idée universelle qui sous-tend le concept de structure est que la combinaison de composants locaux simples dans un modèle cohérent permet aux modélisateurs de décrire des données complexes avec une grande précision.
Le défi que représente l'analyse des « grands » ensembles de données exige également que les chercheurs en sciences appliquées, en biologie et en médecine ou en traitement du signal interagissent avec les chercheurs en mathématiques informatiques pour améliorer la capacité de leurs méthodes traditionnelles et répondre à de nouvelles questions.
Plusieurs méthodes de calcul traditionnelles sont en fait limitées par des hypothèses trop étroites et leur manque de robustesse introduit des erreurs qui peuvent fausser les analyses de données.
C'est le cas lorsque les échantillons présentent des dépendances statistiques complexes, par exemple en raison d'expériences répétées, de plans d'expérience inégaux, de données regroupées ou groupées et de relations spatio-temporelles. Une deuxième source de complexité provient du processus de mesure lui-même, qui peut impliquer des instruments très différents ou enregistrer des données de nature très différente. Les données de grande dimension sont souvent hétérogènes et potentiellement bruyantes ou manquantes, et elles peuvent contenir des informations à plusieurs niveaux sur les échelles spatiales et temporelles du processus observé.
Le projet Persyvact propose des méthodes mathématiques et statistiques pour faciliter l'analyse de données de haute dimension présentant des dépendances complexes et une structure hétérogène ou à plusieurs niveaux. Il aborde des questions importantes dans l'analyse des données numériques à grande échelle, des données génomiques des populations et des grands réseaux de capteurs.
Résultats
Le projet a favorisé les collaborations entre les chercheurs du GIPSA-lab, du LJK et du TIMC-IMAG. Quatre thèses de doctorat co-supervisées par des chercheurs de 2 des 3 laboratoires différents ont commencé depuis octobre 2013. Cinq articles et actes de conférence ont été produits par Persyvact. Le projet Persyvact a organisé de nombreux événements scientifiques dont l'atelier international Statlearn 2015.
Séminaires et réunions
- 20/09/2013 - Réunion de lancement Persyvact
- 17/10/2013 - Séminaire IXXI/Persyvact sur les approches bayésiennes. Plus d'information
- 19-20/11/2013 - Atelier Persyvact "Extremes and copulas". Plus d'information
- 5/12/2014 - Première réunion interdisciplinaire Persyvact entre scientifiques du vivant et mathématiciens appliqués sur la perception humaine des couleurs. Plus d'information
- 14/05/2014 - Séminaire SEMOVI/Persyvact sur l'apprentissage automatique pour la génomique personnalisée.
- 03/07/2014 - Atelier d'une journée sur les modèles graphiques.
- 13-14/11/2014 - 2014 Astrostatical days à Grenoble. Plus d'information
- 31/03/2014 et 01/04/2014 - École de printemps conjointe (avec l'équipe du projet Khronos) sur l'inférence statistique.
- 02-03/04/2014 - Atelier international Statlearn 2015 sur l'apprentissage statistique.
- 05/03/2015 - Réunion de l'action de recherche ADM. Diapos sur le projet Persyvact. Diapos du doctorant Alessandro Chiancone.
Publications
Mairal J. (2015). Incremental majorization-minimization optimization with application to large-scale machine learning. SIAM Journal on Optimization, in press. HAL
Chiancone A., Chanussot J., & Girard S. (2014). Collaborative sliced inverse regression. Rencontre d’astrostatistique. Grenoble, 2014 HAL
Clausel M., Roueff F., Taqqu M., & Tudor C.A. (2014). Asymptotic behavior of the quadratic variation of the sum of two Hermite processes of consecutive orders. Stochastic Processes and their Applications, 124: 2517-2541 HAL
Duforet‐Frebourg, N., & Blum, M. G. (2014). Non-stationary patterns of isolation-by-distance: inferring measures of local genetic differentiation with Bayesian kriging. Evolution, 68(4), 1110-1123. HAL
Duforet-Frebourg, N., Bazin, E., & Blum, M. G. (2014). Genome scans for detecting footprints of local adaptation using a Bayesian factor model. Molecular Biology and Evolution, msu182. HAL
Frichot, E., Mathieu F., Trouillon T., Bouchard G., & O. François (2014) Fast and efficient estimation of individual ancestry coefficients. Genetics 196: 973-983. HAL
He X., Condat L., Bioucas-Dias J., Chanussot J., & Xia J. (2014) A new pansharpening method based on spatial and spectral sparsity priors IEEE Transactions on Image Processing, 23 : 4160-4174. HAL
Mairal, J., Koniusz, P., Harchaoui, Z., & Schmid, C. (2014). Convolutional kernel networks. In Advances in Neural Information Processing Systems (pp. 2627-2635). HAL
Prangle, D., Blum, M. G. B., Popovic, G., & Sisson, S. A. (2014). Diagnostic tools of approximate Bayesian computation using the coverage property. Australia and New Zealand Journal of Statistics, 56: 309-329. HAL
Clausel M, Roueff F, & Taqqu M (2013). Large scale reduction principle and application to hypothesis testing. Electronic Journal of Statistics, 9 :153-203. HAL
Frichot, E., Schoville, S. D., Bouchard, G., & François, O. (2013). Testing for associations between loci and environmental gradients using latent factor mixed models. Molecular biology and evolution, 30(7), 1687-1699. HAL
Membres
- Sophie Achard (CNRS/Gipsa-lab)
- Hacheme Ayasso (UGA/Gipsa-lab)
- Michael Blum (CNRS/TIMC)
- Jean Marc Brossier (Grenoble INP/Gipsa-lab)
- Florent Chatelain (Grenoble INP/Gipsa-lab)
- Jocelyn Chanussot (Grenoble INP/Gipsa-lab)
- Marianne Clausel (UGA/LJK)
- Jean François Coeurjolly (UGA/LJK)
- Laurent Condat (CNRS/Gipsa-lab)
- Michel Desvignes (Grenoble INP/Gipsa-lab)
- Jean Baptiste Durand (Grenoble INP/Gipsa-lab)
- Florence Forbes (INRIA/LJK)
- Olivier François (Grenoble INP/TIMC)
- Stéphane Girard (INRIA/LJK)
- Radu Horaud (INRIA/LJK)
- Sophie Lambert (UGA/TIMC)
- Julien Mairal (INRIA/LJK)
- Marie-José Martinez (UGA/LJK)
- Olivier Michel, PR (Grenoble INP)
- Valérie Perrier (Grenoble INP/LJK)
- Nicolas Thierry-Mieg (CNRS/TIMC)
Coordinateurs
- Michael Blum (CNRS/TIMC)
- Marianne Clausel (UGA/LJK)
- Laurent Condat (CNRS/Gipsa-lab)
- Imprimer
- Partager
- Partager sur Facebook
- Share on X
- Partager sur LinkedIn