Fitting distances and dimension reduction methods with applications

Description: 

Les données observées dans les différentes études dans tous les disciplines de la science peuvent être mesurées selon deux dimensions, le nombre de variables et le nombre d’exemples et dans certains cas comme des distances ou dissimilarités entre les individus. Dans la plupart de ces études, le nombre de variables peut prendre des valeurs élevées ce qui rend leur analyse et leur visualisation assez difficile. Cependant, plusieurs méthodes statistiques ont été conçues pour réduire la complexité de ces données, en utilisant les coordonnées des individus ou bien les distances entre les individus, et permettant ainsi une  meilleure compréhension des connaissances disponibles dans ces données.

Dans cette thèse, notre objectif est de proposer deux nouvelles méthodes d’analyse des données multivariées basé sur l’utilisation des distances entre les paires d’individu. Ces deux méthodes s’appellent en anglais : " Multidimensional Fitting" et "Projection under pairwise distance control".

La première méthode est une dérivée de la méthode de positionnement multidimensionnelle (multidimensional scaling (MDS) en anglais ) dont l’application nécessite la disponibilité des deux matrices décrivant la même population: une matrice de coordonnées et une matrice de distances et l’objective est de modifier la matrice des coordonnées de telle sorte que les distances calculées sur cette matrice soient les plus proches possible des distances observées sur la matrice de distances. Nous avons élargi deux extensions de cette méthode : la première en pénalisant les vecteurs de modification des coordonnées et la deuxième en prenant en compte les effets aléatoires qui peuvent intervenir lors de la modification. Deux applications de ces deux extensions ont été faites sur des données biologiques et des données de la sensométrie.

 

La deuxième méthode est une nouvelle méthode de réduction de dimension basée sur la projection non linéaire des données dans un espace de dimension réduite et qui tient en compte la qualité de chaque point projeté pris individuellement dans l’espace réduit. La projection s’effectue en introduisant des variables supplémentaires, qui s’appellent "rayons", et indiquent dans quelle mesure la projection d’un point donné est précise. Les principales contributions de cette méthode sont de donner une simple visualisation des données en R^2 avec une interprétation simple de la qualité d’approximation et de fournir une nouvelle variante de réduction de la dimensionnalité. Nous avons appliqué cette méthode sur différents types de données.

Date: 
lun 13 mar 2017 13h30
Soutenance (lieu): 
IUT Amphi 1A12
Directeur: 
WICKER Nicolas / AL AYOUBI Baydaa
Candidat: 
ALAWIEH Hiba
type de soutenance: 
Thèse