Vuoi sapere qual è il livello di felicità della città o della provincia in cui ti trovi? Manco a dirlo, la soluzione si trova in un’app. Si chiama iHappy ed è il frutto di un progetto made in Italy che sfrutta l’analisi quotidiana dei “cinguettii” pubblicati su Twitter. Grazie al sistema di geolocalizzazione del social network, i dati sono ordinati in base alla provincia di appartenenza degli utenti e riversati sull’app gratuita per smartphone realizzata da Voices from the Blogs, il progetto che ha dato vita a questa sorta di esperimento sociale collettivo.
Ufficialmente, Voices from the Blogs è uno spin-off di un progetto avviato dall’Università degli Studi di Milano. Ufficiosamente, è un’avventura che si muove tra scienze sociali e statistica, avviata da un eterogeneo gruppo di docenti e ricercatori con toni ben lontani da quelli che ci si potrebbe aspettare in ambito accademico. L’idea originale è quella di sfruttare i Big Data, ovvero il flusso di informazioni che circolano sul web, per trarne indicazioni sulle opinioni di chi ci sta intorno. “Il progetto è partito nel 2011 prendendo in considerazione i blog in lingua italiana” spiega Luigi Curini, tra i fondatori di VfB con Stefano Maria Iacus e Andrea Ceron. “Con il boom di Twitter e dei social network abbiamo deciso però di avviare un progetto parallelo che permettesse di ampliare il campo dell’indagine, che ha finito per varcare i confini del nostro paese”. Un lavoro monumentale, considerando che in Italia, nel 2012, sono circolati circa 43 millioni di tweet (su 4 milioni di utenti registrati). Nel calderone di VfB, però, ne sono finiti parecchi di più. “Dal 31 gennaio 2012 a oggi abbiamo analizzato più di 150 milioni di tweet sui più svariati argomenti” conferma Curini con una punta di incredulità.
Il concetto, in sé, è piuttosto semplice: analizzare ogni singolo tweet per assegnargli un ‘sentiment’ corrispondente a uno stato d’animo. Nella pratica, però, le cose si complicano. “I sistemi automatici che sfruttano dizionari ontologici, usati di solito per l’analisi di grandi quantità di dati, hanno una percentuale di errore molto alta. Quello che noi abbiamo adottato è un sistema che definiamo ‘supervisionato’ e che garantisce un margine di errore decisamente inferiore”. Nella pratica, il metodo adottato da VfB utilizza un’analisi manuale di una parte dei tweet, eseguita da persone fisiche che leggono i singoli messaggi e codificano le modalità di comunicazione usate sul social network. “Queste informazioni vengono poi ‘date in pasto’ a un algoritmo che le utilizza per interpretare la totalità dei tweet, arrivando a un’accuratezza di analisi del 97-98%” prosegue Curini. Un metodo che non si applica solo all’analisi della felicità, ma permette anche indagini sulle opinioni espresse da intere comunità. In tempi recenti, i ragazzi di Voices from the Blogs hanno applicato il loro metodo per analizzare l’andamento delle elezioni presidenziali Usa. Risultato: previsione centrata con uno scarto minimo, azzeccando anche gli swing states che avrebbero accordato la maggioranza a Obama. Un precedente in cui VfB ha stracciato, in quanto ad accuratezza, i classici sondaggi demoscopici.
Addio ai sondaggisti in favore dell’analisi dei Big Data, dunque? La tentazione c’è. Soprattutto se consideriamo che in un mondo in cui la maggior parte delle persone utilizza Internet e i telefoni cellulari, i classici sondaggi demoscopici sfruttano ancora le interviste “a campione” sui telefoni fissi. Sul tema, però, Luigi Curini non si sbilancia più di tanto e preferisce porre l’accento su altri aspetti: “La differenza sostanziale tra un’analisi come quella che eseguiamo a VfB e un normale sondaggio è che non poniamo domande a intervistati, ma ci limitiamo a raccogliere le opinioni espresse spontaneamente da chi usa i social network. Non è necessariamente un metodo migliore o peggiore, è semplicemente diverso”.