In: Data Science & Machine Learning
Le nuove tecniche di Machine Learning per la Social Network Analysis (SNA) permettono di sfruttare la diffusione pervasiva dei social network (Facebook, Linkedin, Twitter, Instagram, Google+, ecc), di analizzarne i contenuti in modo nuovo ed analitico e di ricavarne importanti insight commerciali o legali. In tempo reale.
La SNA è oggi utilizzata in modo crescente nel marketing per individuare gli influencer nell’Internet pubblico (i social veri e propri) od in una comunità di recensori di prodotti (nei siti di e-commerce aziendali) allo scopo di mirare il marketing (targeted marketing). Tipiche domande alle quali la SNA può dare una risposta oggettiva e numerica sono: chi sono gli influencer principali della rete/sottorete? che impatto hanno sugli altri? quanto “valgono”? che relazioni hanno con gli altri? Oppure: a quali persone della rete fare pubblicità di un prodotto? Oppure ancora: quali clienti del sito e-commerce sono “leali” (cioè fedeli)? La SNA è anche usata per individuare ed analizzare le comunità informali e di pratica dentro un’azienda, allo scopo di migliorare la comunicazione e l’integrazione delle persone, anche dopo fusioni ed acquisizioni aziendali (ONA=Organizational Network Analysis). La SNA, poi, è usata anche in altri ambiti quali il rilevamento frodi e riciclaggio (money lendering), la scelta della pubblicità da mostrare agli utenti (targeted advertising), la selezione del personale da assumere (optimized recruiting), l’ottimizzazione logistica, l’analisi del traffico telefonico e la prevenzione del cyber-crime. La SNA è utilizzata massivamente dietro le quinte da Google Maps e da molti altri siti importanti ed è una competenza oggi irrinunciabile per un’azienda moderna. Si veda al fondo la lista dei Casi d’Uso illustrati nel corso.
Il corso è di tipo “hands-on” con il linguaggio R.
NB. I principali social network rendono disponibili i loro dati pubblici previa iscrizione individuale gratuita come “developer” alle rispettive API: il corso illustrerà le modalità operative per farlo per i principali social network. Per seguire il corso, comunque, non è richiesto l’accesso e l’iscrizione ai suddetti social network, perché saranno utilizzati dataset precedentemente scaricati.
Contenuti
- La SNA oggi:
- Motivazioni;
- Driver;
- Diffusione;
- Ambiti di utilizzo tipici della SNA;
- Esempi “storici” di successo della SNA.
- Preliminari:
- I dati social non-strutturati (unstructured): connessioni tra persone, tweet, raccomandazioni, recensioni, persone seguite, ecc;
- La tipica architettura di accesso ai dati social (Packt);
- La tecnica di base: la Graph Analysis, applicata ai social network: nodi, connessioni (edge), liste di connessioni (edge list) e matrici di adiacenza;
- Tipi di Graph Analysis: analisi dei cammini, analisi della connettività, analisi della comunità, analisi della centralità;
- Costruire “reti di prova” per impratichirsi con gli strumenti di SNA: come fare;
- Esercizi con reti di prova.
- Accesso ai dati dei social (di dettaglio):
- Iscriversi come “developer” a Facebook, Linkedin, Instagram e Twitter per accedere ai dati pubblici: cosa fare;
- Estrarre i dati da Facebook, Linkedin, Instagram e Twitter e caricarli in R: come fare.
- Analisi base sui dati social:
- Individuare la comunità da analizzare;
- Individuare i nodi centrali ed i ponti;
- Misurare la centralità e “l’influenza” di una persona: varie tecniche;
- Misurare la “distanza” business tra le persone della rete/comunità;
- La centralità di una persona in base all’importanza dei suoi vicini (eigen centrality) e come visualizzarla.
- Visualizzazione delle reti e dei dati social:
- Visualizzare la nuvola dei nodi e connessioni;
- Selezionare un nodo (persona) dalla lista delle connessioni e vedere le sue connessioni evidenziate graficamente;
- Selezionare un nodo sul grafico e vederlo evidenziato nella lista delle connessioni;
- Visualizzare la direzione delle connessioni (chi segue chi);
- Grafici social avanzati ed interattivi;
- Grafici social a 2 e 3 dimensioni;
- Pattern grafici di connessione.
- Analisi avanzate:
- Ordinare gli influencer della comunità per impatto;
- Individuare le sotto-comunità coese, cioè fortemente connesse (network clustering);
- Analizzare come le reti evolvono nel tempo (temporal SNA) e la fedeltà degli utenti;
- Misurare le caratteristiche di una sotto-comunità;
- Individuare i “ponti” tra sotto-comunità;
- Individuare le persone “compatibili” con un’altra (matching).
- Conclusioni:
- Limiti e sfide della SNA oggi;
- Altre tecnologie/tool di SNA oltre ad R? uno sguardo veloce.
Alcuni dei casi d’uso illustrati nel corso:
- Determinare la probabilità che un follower sia influenzato da un influencer nei suoi comportamenti (per il marketing mirato);
- Customizzare una campagna di marketing (in base al clustering di persone simili);
- Identificare gli utenti del sito e-commerce fedeli nel tempo;
- Individuare ed analizzare una comunità informale od una comunità di pratica dentro un’azienda (tramite quick poll & survey, intranet, email, blog, ecc);
- Costruire e visualizzare reti di tweet per argomento (per il recruiting);
- Scoprire le reti “egocentriche”, cioè formate da persone connesse e con lo stesso job title (per il recruiting);
- Rilevare le frodi nel mondo Telecom e Finance tramite la rete di contatti abituali dei clienti (i cosiddetti guilt-by-associations); si mostrerà come informazioni non-strutturate dei social network possano essere trasformati in caratteristiche utili di una persona (cliente).
Dataset utilizzati nel corso, tra gli altri: i Social circles di Facebook, Twitter e Google+ dallo SNAP della Stanford University.
Durata
- 14 ore
- 2 giorni
Prerequisiti
Una conoscenza di base del linguaggio R.
Durata: 14 ore (2 giorni)
Solo su richiesta
Questo corso è erogabile solo su richiesta, in modalità on-line (con formazione a distanza), oppure on-site, sempre personalizzati secondo le esigenze.