Apprentissage semi-supervisé et apprentissage actif - REPORTE

Probabilités et Statistique

Lieu: 
Salle séminaire M3-324
Orateur: 
Emilie Devijver
Affiliation: 
CNRS (Grenoble)
Dates: 
Mercredi, 1 Avril, 2020 - 10:30 - 11:30
Résumé: 
 
Dans cet exposé, on introduira l'apprentissage semi-supervisé multiclasse, où on observe beaucoup de données à labelliser, et quelques unes sont labellisées (mais très peu).
Ces jeux de données sont très fréquents, notamment quand les données sont chères à étiqueter (besoin d'un expert des données) ou quand on a beaucoup d'observations.
Bien que le cas binaire soit fortement étudié, peu de résultats existent dans le cas multiclasse.
J'introduirai une méthode pour apprendre un classifieur dans ce cadre, validée par une borne transductive sur le risque du classifieur de Bayes.
Finalement, je discuterai d'un travail en cours sur l'apprentissage actif : il s'agit de choisir, à partir d'un jeu de données non labelisées, les quelques observations qui seront étiquetées (par un expertpour améliorer les performances du classifieur. On propose d'étudier pour cela la topologie des données.