Modelli di voto: proiezione non lineare con t-SNE

Sulla carta della Svizzera qui sotto, ogni comune è rappresentato con un colore che rappresenta il suo comportamento di voto, come si ottiene con una proiezione non lineare utilizzando l'algoritmo "t-SNE" tra il 1981 e oggi. Due comuni di colore simile hanno abitudini di voto simili: sono vicini l'uno all'altro nella nuvola di punti (a destra). Osservare, ad esempio, le differenze tra i centri urbani e le aree rurali, o tra le diverse regioni linguistiche.

Spiegazione

Nella nuvola di punti soprastante, ogni comune è rappresentato da un punto. Questa rappresentazione è ottenuta direttamente dai risultati del comune utilizzando una tecnica di riduzione delle dimensioni chiamata "algoritmo t-SNE". Sulla carta della Svizzera, il colore dei comuni è determinato dalla loro posizione nella dispersione bidimensionale. Due comuni sono vicini l'uno all'altro in questo spazio se votano in modo simile.

A differenza dell'analisi dei componenti principali della proiezione lineare, l'algoritmo t-SNE cattura le relazioni non lineari presenti nei dati di voto. Informalmente, l'algoritmo cattura le somiglianze relative tra i comuni nel set di dati completo e cerca di preservare queste somiglianze in due dimensioni. È quindi possibile che l'algoritmo riveli più informazioni e generi la visualizzazione di cui sopra. Tuttavia, non è più possibile interpretare facilmente i due assi.

Come per l'analisi dei componenti principali, c'è un clustering linguistico. Sorprendentemente, tuttavia, appare anche un sottogruppo per cantone. Prendiamo ad esempio il gruppo corrispondente al cantone di Berna: le donne bernesi di lingua tedesca sono sul lato destro del grafico, mentre i comuni di lingua francese sono sul lato sinistro. I comuni bernesi sono prima raggruppati per lingua e poi raggruppati nel loro sottogruppo cantonale. Analogamente all'analisi delle componenti principali, il cantone del Vallese ha una struttura di voto unica: è isolato nella parte superiore del grafico, ma è comunque separato in due gruppi linguistici.