Remapping Switzerland with t-SNE

Ci-dessous, chaque commune est représentée par un point dans le graphique de droite. À gauche, la carte géographique de la Suisse représente les communes coloriées en fonction de leur position dans le graphique.

Partager cette page Partager sur Facebook Partager sur Twitter Partager sur Google+

Explications

Dans la partie de droite ci-dessus, chaque point correspond à une commune. Cette représentation est obtenue à partir de l’ensemble des résultats (le pourcentage de « oui ») par commune et par votation nationale via une technique de réduction de dimension appelée algorithme de t-SNE.

Contrairement à l’analyse en composantes principales telle qu’utilisée dans les habitudes de vote, l’algorithme de t-SNE permet de capturer des relations non-linéaires dans les données. De manière informelle, l’algorithme capture la similarité relative entre les communes du jeu de données et tente de préserver ces similarités dans une espace à deux dimensions. Il révèle ainsi d’autres tendances de vote en deux dimensions, telles que montrées dans la visualisation ci-dessus. Il est néanmoins difficile d’interpréter facilement les deux axes.

En accord avec l’analyse en composantes principales, on observe un regroupement par langue des communes. Cependant, et d’autant plus remarquable, un sous-regroupement plus fin par canton est également obtenu. Par exemple, repérez les points correspondant au canton de Berne : les communes germanophones se trouvent à droite du graphique, alors que les communes francophones se trouvent à gauche. Les communes de Berne sont ainsi d’abord séparées par langue, puis groupée dans leur sous-groupe cantonal. Conformément à l’analyse en composantes principales, le Valais, isolé en haut du graphique, présente un comportement unique de vote. Il est néanmoins séparé en deux groupes en fonction de la langue de chaque commune.

Le menu déroulant permet de sélectionner quelle donnée utiliser pour colorier les points correspondant aux communes. Le plus intéressant est d’examiner le canton appartenant à chaque commune. Pour réduire le nombre d’éléments de la légende, il est possible de sélectionner uniquement les cantons d’un certain groupe linguistique.

Dans la partie de gauche ci-dessus, la couleur de chaque commune est déterminée en fonction de sa position dans l’espace bi-dimensionnel à droite.