Classification d’aires de dispersion à l’aide d’un facteur géographique
Application à la dialectologie
1 Université Grenoble Alpes, CNRS, Grenoble INP, LIG clement.chagnaud@univ-grenoble-alpes.fr
2 Université Grenoble Alpes, CNRS, Grenoble INP, LJK philippe.garat@univ-grenoble-alpes.fr
3 Université Grenoble Alpes, CNRS, Grenoble INP, PACTE paule-annick.davoine@univ-grenoble-alpes.fr
4 Université Côte d’Azur, CNRS, BCL guylaine.brun-trigaud@univ-cotedazur.fr
Nous proposons une procédure d’analyse statistique multidimensionnelle couplant des méthodes de projection et de classification pour identifier des ensembles cohérents au sein d’un corpus d’entités géographiques surfaciques que l’on appelle aires de dispersion. La méthodologie intègre un facteur géographique dans la construction de l’espace de représentation pour la projection des données. En appliquant ces méthodes sur des données géolinguistiques, nous pouvons identifier et expliquer de nouvelles structures spatiales au sein d’un corpus d’aires de dispersion de traits linguistiques.
Abstract
We propose a multidimensional statistical analysis procedure using projection and classification methods, in order to identify coherent clusters into a set of surficial entities called dispersion areas. The methodology includes a geographical factor to build the representation space for the projection of the data. By applying this method on geolinguistic data, we are able to identify and explain new spatial patterns among a set of dispersion areas of linguistic features.
Mots clés : géolinguistique / classification / analyse spatiale / statistiques / humanités numériques
Key words: geolinguistics / geomatics / clustering / spatial analysis / statistics / digital humanities
© 2020 Lavoisier