In: Data Science & Machine Learning
R è il linguaggio per eccellenza della Data Science, il più usato al mondo.
Il corso illustra, con esempi concreti ed aziendali, gli aspetti più avanzati del linguaggio R per la Data Science.
Corso pratico. L’ambiente di lavoro è RStudio.
Non necessario il set-up aula, i partecipanti porteranno i loro portatili.
I contenuti sono i seguenti:
- Statistica multivariata con R: introduzione
- Metodi, pacchetti procedure per il calcolo delle dimensioni campionarie
- Metodi avanzati per dati mancanti
- Rilevamento degli outlier: tecniche avanzate
- Inferenza con R (CI e test)
- Inferenza con R: intervalli di confidenza e test
- Test di di normalità
- Test della varianza
- Test multiplo (Bonferroni, FWER vs FDR, Hotelling)
- Valutazione della qualità del modello con la cross-validation
- Output dei principali modelli di analisi statistica: struttura ed interpretazione
- Grafica avanzata con ggplot2 (introduzione alla grammar of graphics)
- Programmazione avanzata ed efficiente con R
- Debuggare codice R
- Costruire report dinamici in R
- Produrre output con RMarkdown
- Algebra lineare con R: cenni
- Modificare la versione di R
- Trucchi utili con R
- Big data con R
- Novità 2020 in R
Durata
- 14 ore
- 2 giorni
Prerequisiti
Introduzione al linguaggio R
Durata: 14 ore (2 giorni)
Solo su richiesta
Questo corso è erogabile solo su richiesta, in modalità on-line (con formazione a distanza), oppure on-site, sempre personalizzati secondo le esigenze.