In: Data Science & Machine Learning
R è il linguaggio per eccellenza della Data Science, il più usato al mondo. E’ completamente open-source, ricco di prodotti collaterali anch'essi tutti gratuiti, incluso un ambiente di sviluppo avanzato (R Studio). Due grandi punti di forza di R, inoltre, sono: la disponibilità di una grande e sempre crescente quantità di pacchetti e funzioni sviluppate in continuo in tutto il mondo, per praticamente qualsiasi ambito della Data Science; e la disponibilità di pacchetti grafici avanzati, per qualsiasi tipo di grafico ed in generale per qualsiasi necessità di Data Visualization. Il tutto affidabile e ben testato.
Il corso introduce il partecipante all'uso di R per la Data Science.
Corso pratico: non necessario il set-up aula, i partecipanti porteranno i loro portatili.
I contenuti sono i seguenti:
- Introduzione ad R
- Le mani su R
- Partire: scaricare, installare ed aggiornare R ed R Studio
- Entrare ed uscire da R Studio
- Muoversi in R Studio: tour dell’interfaccia e dei 4 pannelli
- Installare e caricare i package
- I repository dei package R: CRAN e GITHub
- Personalizzare le sessioni R Studio con .Rprofile
- Salvare ed esportare dati e risultati
- L’ambiente di R ed i default
- Esercizi
- Le basi di R
- Classi, oggetti e metodi
- La matematica con R (manipolazioni di base)
- I tipi di dati
- Gli scalari
- I vettori
- Le matrici
- Le liste
- I fattori
- Le array
- I dataframe
- Creazione degli oggetti
- Indicizzazione (metodi)
- Cammini di ricerca
- Mascheramento degli errori
- Operatori di assegnazione
- Esercizi
- Input / Output dei dati
- Lettura dei dati da file o DB
- Scrittura dei dati su file o DB
- Importazione dei dati (vari formati)
- Esportazione dei dati (vari formati)
- Funzioni di esame dei dati
- Esercizi
- Elaborazione dei dati
- Vettorizzazione
- Sequenze regolari
- Date
- Trasformazioni numeriche
- Stringhe e loro manipolazione
- Booleani e confronti
- Gli insiemi vuoti
- I dati mancanti
- Sort & order
- Manipolazione di matrici
- Esercizi
- Le funzioni
- Cosa sono
- La struttura
- Come crearle
- Esercizi
- Varie
- Grandi moli di dati: come gestirle.
Durata
- 7 ore
Prerequisiti
Durata: 7 ore
Solo su richiesta
Questo corso è erogabile solo su richiesta, in modalità on-line (con formazione a distanza), oppure on-site, sempre personalizzati secondo le esigenze.