Visualizzare le relazioni tra le lingue tramite il web
Il successo del motore di ricerca Google si basava sul concetto, tanto semplice quanto geniale, di utilizzare i link come parametro per ordinare per importanza le pagine web. E se volessimo applicare lo stesso semplice concetto per identificare la lingue più importanti del web?
Due ricercatori di Google, Daniel Ford e Josh Batson hanno analizzato i link verso pagine web in una lingua differente da quella di provenienza e hanno così realizzato un grafo di relazioni tra le principali lingue del web. Nel grafo soprastante, relativo ad un campionamento dei link effettuato nel 2008, è possibile visualizzare i nodi delle principali lingue (con diametro proporzionale alla quantità di pagine in quella lingua) eccettuata la lingua Inglese, principale nodo per la quale è stato pubblicato un grafo apposito.
Il grafo evidenzia ben distinti il continente europeo da quello asiatico, ed all’interno del gruppo linguistico europeo relazioni forti tra le regioni baltiche, dell’Europa orientale e della penisola iberica. I nodi più attrattivi appaiono quelli delle lingue tedesca e russa, quelli che secondo un modello algoritmico HITS verrebbero definiti Nodi “autorità”. Ma mentre il nodo russo esercita un’influenza per lo più nelle regioni ex URSS (ma anche dal nodo inglese, che pare influenzato anche dallo spagnolo e dal cinese), il nodo tedesco si trova più o meno al centro del grafo, esercitando un’influenza diffusa anche in regioni geograficamente lontane.
Il nodo della lingua italiana si trova in posizione periferica, e pare influenzato in particolare dai nodi delle lingue inglese, francese e tedesca. Con un 22% di link in uscita verso pagine inglesi il nodo italiano si posiziona tra i più anglofoni in Europa, insieme a quelli di Spagna e Olanda. Le pagine web in lingua italiana paiono esercitare un’influenza rilevante solo nei confronti dell’Albania.
Sicuramente un’interessante fotografia delle relazioni tra le lingue nel web nel 2008.