Convergence des mesures invariantes des marches aléatoires sur les graphes de voisinage par la méthode de Stein

Probabilités et Statistique

Lieu: 
Salle séminaire M3-324
Orateur: 
Thomas Bonis
Affiliation: 
Telecom ParisTech
Dates: 
Mercredi, 21 Juin, 2017 - 10:30 - 11:30
Résumé: 

Il existe de nombreux algorithmes pour analyser des graphes. Souvent, ces algorithmes peuvent être utilisés pour étudier des données multivariées : pour cela, il suffit de construire un graphe de voisinage à partir des données et d'utiliser un algorithme d'analyse de graphe. Cependant, on peut se demander si le graphe de voisinage utilisé capture bien toute l'information qui était présente dans les données initiales. Supposons que nos données soient des réalisations de variables aléatoires i.i.d. tirées selon une certaine mesure $\mu$ de densité $f$ ; si l'on arrive à montrer que l'on peut retrouver la densité $f$ à partir d'un graphe de voisinage construit sur les données, alors on peut penser que ce graphe contient bien toute l'information statistique d'intérêt. En fait, on sait que dans la plupart des cas, la mesure invariante d'une marche aléatoire sur un graphe de voisinage est une approximation de la mesure invariante d'un processus de diffusion dont la densité peut être utilisée pour retrouver $f$. Cependant, il n'existe pas de résultat quantitatif permettant d'évaluer cette approche.
Dans cet exposé, on présentera de nouveaux résultats, basés sur la méthode de Stein, permettant de borner la distance de Wasserstein d'ordre $2$ entre la mesure invariante d'une chaîne de Markov et la mesure invariante d'un processus de diffusion. Puisqu'une marche aléatoire sur un graphe (de voisinage) est une chaîne de Markov, on peut ainsi obtenir des résultats quantitatifs pour l'estimation de densité via les graphes de voisinages. Par ailleurs, l'approche développée peut être utilsée pour étudier d'autres problèmes : on est ainsi capable de donner des vitesses de convergence pour les distances de Wasserstein d'ordre $\geq 2$ pour le théorème Centrale Limite.