mindthegap/embers.tex
2017-08-18 13:56:42 +02:00

54 lines
7.9 KiB
TeX

\section{Embers}
Nel 1951 Isaac Asimov pubblica una serie di racconti di fantascienza, poi raccolti nella Trilogia della Fondazione, la storia ruota attorno al crollo dell'Imper Galattico e della cricca di scienziati che la prevedono con l'ausilio della Psicostoriografia.
Se l'autore è famoso per le Tre leggi della robotica, il suo contributo nella sociologia è meno palese ma altrettanto importante: la psicostoriografia si delinea come la scienza delle masse, una misto tra economia e sociologia, che attraverso il processamento delle informazioni disponibili alla 'regia accademia' dell'Impero riesce a prevedere e prevenire il fragoroso crollo politico della galassia. Sorvoleremo sull'autentico positivismo di Asimov e sulle implicazioni politiche del libro, ma vorremo riprendere questa neonata scienza per capire quali sono le sue possibilità e se nei 70 anni che ci separano dalla pubblicazione del testo la tecnologia si è evoluta abbastanza da considerare realtà il sogno dello scrittore statunitense.
Il problema della psicostoriografia è la previsione degli sconvolgimenti sociali, è la capacità di leggere tra le righe della storia e anticipare il futuro, compito degli psicostoriografi è maneggiare questa conoscenza e stimolare la massa nel modo efficace a realizzare il futuro voluto. Questa scienza ha il limite della massa, non dà risultati se il campione è troppo ristretto, e allo stesso modo non può anticipare le scelte degli individui, né tantomeno prevedere le strategie dei leader politici, tuttavia risulta esatta e 'computabile' se il soggetto in analisi è la vasta popolazione dell'Impero Galattico.
La psicostoria è, così presentata, la scienza che ciascun governante vorrebbe dalla sua, essa permette di prevedere e prevenire le dissidenze e armonizzare i conflitti interni con opportune politiche.
Ma questa scienza non è certo figlia del futuro, anzi sappiamo come la suggestione delle masse è una pratica consueta nei governi occidentali, un esempio a noi vicino è la recente guerra in Iraq, che ha guadagnato il consenso della popolazione americana attraverso la diffusione ad arte di informazioni false sulle armi di distruzione di massa nelle mani di Saddam. O ancora, come lo stragismo nero dell'Italia '70 ha stimolato la popolazione a votare per la sicurezza e la stabilità proposta dalle forze moderate e ha impedito l'ascesa della sinistra radicale.
Insomma, non serve prevedere matematicamente i risultati per stimolare la massa a comportarsi come voluto, piuttosto servono le risorse di cui uno Stato dispone, serve un controllo efferato sugli organi di stampa e
\textit{Che c'entra tutto questo con Mind The Gap? } Semplice, questa tecnologia è
Sviluppato dal Descovery Analitics Centre della Virginia Polytechic Institute EMBERS è un progetto che dal 2012 predice ogni giorno 45-50 eventi di rilevanza sociale in molti paesi del Sud America. \cite{Butler}
I finanziamenti arrivano (22 milioni) dall'agenzia di intelligence di stato americana (IARPA) \footnote{\url{https://www.iarpa.gov/
}} in quanto parte del progetto OSI (Open Source Indicators, \footnote{\url{https://www.iarpa.gov/index.php/research-programs/osi}} ), con una collaborazione attiva in termini di ricercatori e finanziamenti di molte università americane.
Lavora utilizzando dati come tweets, pagine facebook , blog posts, ricerche di Google, Wikipedia, dati metereologici, indicatori finanziari ed economici, immagini satellitari. I dati utilizzati sono OpenSource, ovvero accessibili attraverso internet da qualsivoglia operatore, questi dati, che sono di fatto BigData, sono definiti dagli autori del progetto come \textit{massivi, passivi}
Instancabile il programma lavora 24h, 7su7, offrendo pronostici sugli eventi che sconvolgeranno i paesi posti sotto osservazione.
I tipi di eventi prevedibili sono epidemie di malattie rare o di influenze, rivolte ed elezioni poilitche; ma gli autori del progetto sono, inaspettatamente, interessati alle ultime due classi di eventi.
Nell'articolo già citato, con cui Embers si presenta al mondo, i ricercatori elencano i successi ottenuti nella previsione di eventi quali la primavera brasiliana del 2013, le violente proteste degli studenti venezuelani del 2014, le elezioni presidenziali di Panama e Colombia sempre del 2014.
EMBERS si presenta come il fiore all'occhiello della ricerca in casa Iarpa, infatti rispetto ai presistenti progetti (ICEWS, PITF), il sistema ha un'accuratezza elevata, fino ad indicare città, giorno e volume dell'assembramento di persone.
Inoltre, l'utilizzo di motori per l'analisi e la produzione di testo naturale consente un certo livello di comprensione del fenomeno in questione, e finanché una narrazione dell'evento:
\begin{figure}
\centering
\includegraphics[width=0.7\linewidth]{images/embers-narrazione}
\caption{An example narrative for a EMBERS alert message. Here, color red indicates named entities, green refers to descriptive protest related keywords. Items in blue are historical or real time statistics and those in magenta refer to inferred reasons of protest.}
\label{fig:embers-narrazione}
\end{figure}
Per capire come un marchingegno del genere possa funzionare entriamo nel dettaglio del sistema:
Il processo di analisi di embers comprende quattro stadi:
\begin{itemize}
\item \textit{Ingestion}: aquisizione dei dati OS dalle varie fonti elencate, per far ciò serve un sacco di spazio e delle connessioni molte veloci.
\item \textit{Enrichment}: qui i dati vengono 'migliorati', il testo viene processato e si tenta di iferire la città e altre informazioni sull'autore del post o del tweet.
\item \textit{Modeling} A questo punto viene compiuta l'analisi secondo i modelli che costituisconoil core di EMBERS. Qua avviene il miracolo big data: i dati vengono messi i relazione e si esplorano la semantica e il volume delle manifestazioni programmate. Gli algoritmi messi in campo sono i seguenti:
- Planned Protest Model; dai social sono identificati specifici segni di chiamate a eventi di protesta (con luogo e data);
- Dynamic Query expansion; usa twitter per identificare tempo e luogo di diffusione nell'uso di alcune parole chiavi legate alle proteste;
- Volume-based model si serve di molti dati di indicatori sociali, economici, politici.
- Cascade regression model modellizza le attività su Twitter che siano legate con organizzazioni e mobilitazioni;
- Baseline model usa un modello di stima a partire dallo storico degli eventi del GSR (a monthly catalog of events as reported in newspapers of record in 10 Latin American countries).
\item \textit{Selection } Integrazione dei risultati e presentazione delle predizioni finali, come in Fig. \ref{fig:embers-narrazione}
\end{itemize}
Preferiamo non entrare nel merito dei risultati, di capire quali sono le particolarità del processamento dei dati, perchè questi sono dettagli del progetto e nel corso degli anni miglioreranno. Piuttosto potremmo cercare di capire quali sono gli obiettivi di tale progetto, e con quale spirito questa ricerca viene messa in atto.
Infine
Nella presentazione del progetto non si elude di affrontare anche le implicazioni etiche di questo! Si tratta di uno strumento che certamente può degenerare se nelle mani sbagliate, come per esempio quelle di un governo autoritario non democratico. Al contrario il popolo è salvo se EMBERS è utilizzato da un governo attento e premuroso come quello statunitense! Anzi, in queste circostanze è da considerare come sensore accurato degli umori dei cittadini rispetto alle politiche governative, uno strumento capace di far sentire più forte la voce di tutti, di avvicinare palazzi del potere e mondo che li circonda.
Obbiettivi:
-affinare sempre di più la precisione della previsione;
-cercare di ridurre sempre più l'lemento umano necessario allo sviluppo dell'analisi, attualmente il suo ruolo maggiore è quello di generare il GSR (ancora una volta si esplicita quanto l'elemento umano sia il problema da eliminare per ottimizzare).