Bornes "post hoc" : combien de faux positifs parmi les variables sélectionnées ?

Probabilités et Statistique

Lieu: 
Salle séminaire M3-324
Orateur: 
Etienne Roquain
Affiliation: 
LPSM, Sorbonne Université
Dates: 
Mercredi, 12 Décembre, 2018 - 10:30 - 11:30
Résumé: 

Pour trouver les variables intéressantes dans des données volumineuses, l'utilisateur aime "fouiller" dans les données à la recherche de l'information pertinente, en utilisant les données plusieurs fois. L'inconvénient est que l'étape de sélection invalide les garanties des procédures statistiques classiques. Nous présenterons un cadre formel qui contourne cette difficulté, en proposant des bornes de confiances sur le nombre de faux positifs valides simultanément sur tous les ensembles sélectionnés.

Ce travail est joint avec Gilles Blanchard, Guillermo Durand and Pierre Neuvial.