embers.tex 4.9 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344
  1. \section{Embers}
  2. Sviluppato dal Descovery Analitics Centre della Virginia Polytechic Institute EMBERS è un progetto che dal 2012 predice ogni giorno 45-50 eventi di rilevanza sociale in molti paesi del Sud America. \cite{Butler}
  3. I finanziamenti arrivano (22 milioni) dall'agenzia di intelligence di stato americana (IARPA) \footnote{\url{https://www.iarpa.gov/
  4. }} in quanto parte del progetto OSI (Open Source Indicators, \footnote{\url{https://www.iarpa.gov/index.php/research-programs/osi}} ), con una collaborazione attiva in termini di ricercatori e finanziamenti di molte università americane.
  5. Lavora utilizzando dati come tweets, pagine facebook , blog posts, ricerche di Google, Wikipedia, dati metereologici, indicatori finanziari ed economici, immagini satellitari. I dati utilizzati sono OpenSource, ovvero accessibili attraverso internet da qualsivoglia operatore, questi dati, che sono di fatto BigData, sono definiti dagli autori del progetto come \textit{massivi, passivi}
  6. Instancabile il programma lavora 24h, 7su7, offrendo pronostici sugli eventi che sconvolgeranno i paesi posti sotto osservazione.
  7. I tipi di eventi prevedibili sono epidemie di malattie rare o di influenze, rivolte ed elezioni poilitche; ma gli autori del progetto sono, inaspettatamente, interessati alle ultime due classi di eventi.
  8. Nell'articolo già citato, con cui Embers si presenta al mondo, i ricercatori elencano i successi ottenuti nella previsione di eventi quali la primavera brasiliana del 2013, le violente proteste degli studenti venezuelani del 2014, le elezioni presidenziali di Panama e Colombia sempre del 2014.
  9. EMBERS si presenta come il fiore all'occhiello della ricerca in casa Iarpa, infatti rispetto ai presistenti progetti (ICEWS, PITF), il sistema ha un'accuratezza elevata, fino ad indicare città, giorno e volume dell'assembramento di persone.
  10. Inoltre, l'utilizzo di motori per l'analisi e la produzione di testo naturale consente un certo livello di comprensione del fenomeno in questione, e finanché una narrazione dell'evento:
  11. \begin{figure}
  12. \centering
  13. \includegraphics[width=0.7\linewidth]{images/embers-narrazione}
  14. \caption{An example narrative for a EMBERS alert message. Here, color red indicates named entities, green refers to descriptive protest related keywords. Items in blue are historical or real time statistics and those in magenta refer to inferred reasons of protest.}
  15. \label{fig:embers-narrazione}
  16. \end{figure}
  17. Per capire come un marchingegno del genere possa funzionare entriamo nel dettaglio del sistema:
  18. Il processo di analisi di embers comprende quattro stadi:
  19. \begin{itemize}
  20. \item \textit{Ingestion}: aquisizione dei dati OS dalle varie fonti elencate, per far ciò serve un sacco di spazio e delle connessioni molte veloci.
  21. \item \textit{Enrichment}: qui i dati vengono 'migliorati', il testo viene processato e si tenta di iferire la città e altre informazioni sull'autore del post o del tweet.
  22. \item \textit{Modeling} A questo punto viene compiuta l'analisi secondo i modelli che costituisconoil core di EMBERS. Qua avviene il miracolo big data: i dati vengono messi i relazione e si esplorano la semantica e il volume delle manifestazioni programmate. Gli algoritmi messi in campo sono i seguenti:
  23. - Planned Protest Model; dai social sono identificati specifici segni di chiamate a eventi di protesta (con luogo e data);
  24. - Dynamic Query expansion; usa twitter per identificare tempo e luogo di diffusione nell'uso di alcune parole chiavi legate alle proteste;
  25. - Volume-based model si serve di molti dati di indicatori sociali, economici, politici.
  26. - Cascade regression model modellizza le attività su Twitter che siano legate con organizzazioni e mobilitazioni;
  27. - Baseline model usa un modello di stima a partire dallo storico degli eventi del GSR (a monthly catalog of events as reported in newspapers of record in 10 Latin American countries).
  28. \item \textit{Selection } Integrazione dei risultati e presentazione delle predizioni finali, come in Fig. \ref{fig:embers-narrazione}
  29. \end{itemize}
  30. Nella presentazione del progetto non si elude di affrontare anche le implicazioni etiche di questo! Si tratta di uno strumento che certamente può degenerare se nelle mani sbagliate, come per esempio quelle di un governo autoritario non democratico. Al contrario il popolo è salvo se EMBERS è utilizzato da un governo attento e premuroso come quello statunitense! Anzi, in queste circostanze è da considerare come sensore accurato degli umori dei cittadini rispetto alle politiche governative, uno strumento capace di far sentire più forte la voce di tutti, di avvicinare palazzi del potere e mondo che li circonda.
  31. Obbiettivi:
  32. -affinare sempre di più la precisione della previsione;
  33. -cercare di ridurre sempre più l'lemento umano necessario allo sviluppo dell'analisi, attualmente il suo ruolo maggiore è quello di generare il GSR (ancora una volta si esplicita quanto l'elemento umano sia il problema da eliminare per ottimizzare).