Ajustement de systèmes dynamiques

Probabilités et Statistique

Lieu: 
Salle séminaire M3-324
Orateur: 
Yann Ollivier
Affiliation: 
Facebook Artificial Intelligence Lab
Dates: 
Mercredi, 15 Novembre, 2017 - 10:30 - 11:30
Résumé: 

L'apprentissage des paramètres d'un système dynamique pour que ses
trajectoires présentent des propriétés voulues est au coeur de
l'utilisation des réseaux de neurones pour modéliser des données
temporelles (texte, séries numériques, traduction automatique...).

Une approche standard est une descente de gradient stochastique sur un
signal d'erreur. Malheureusement cet algorithme a l'inconvénient de
"remonter le temps" le long de la trajectoire, ce qui nécessite de
l'entraîner à partir d'un grand nombre de trajectoires courtes qui sont
chacune analysées en partant de la fin. Cela rend impossible
l'apprentissage en temps réel.

Un problème similaire se retrouve dans d'autres modèles, par exemple,
l'ajustement de modèles markoviens pour prédire des observations.

Nous présenterons une analyse mathématique de la convergence de nouveaux
algorithmes pour l'ajustement en temps réel d'un système dynamique.
Contrairement aux approches précédentes, nous n'avons pas besoin
d'hypothèses probabilistes sur l'environnement du système.