Introduzione al Corso

Analisi Dati e Statistica, 2024–25

Paolo Bosetti

Università di Trento, Dipartimento di Ingegneria Industriale

Ultimo aggiornamento: 05/12/2024

Introduzione al corso

Di cosa ci occuperemo per le prossime 60 ore assieme

Analisi statistica dei dati

Questo corso fornisce le competenze essenziali perché un ingegnere sia in grado di analizzare e visualizzare correttamente i dati risultanti da esperimenti scientifici (cioè condotti in laboratorio) o industriali (cioè condotti sul campo, ottenendo dati direttamente da un sistema di produzione)

Analisi statistica dei dati

Ogni esperimento è basato su un’operazione di misura, la quale produce dati quantitativi che contengono un contributo deterministico e un contributo aleatorio, cioè casuale

  • Il primo è proprio del fenomeno in analisi
  • il secondo deriva dal contesto: condizioni operative, sistema di misura, materie prime, condizioni ambientali, operatore, ecc.

Un bravo sperimentatore ha le competenze che gli consentono di isolare il primo contributo dal secondo, ottenendo quindi informazioni più affidabili e ripetibili

Inoltre, un bravo sperimentatore è in grado di comunicare i risultati in modo chiaro e comprensibile e presentandoli in maniera efficace (grafici!)

Analisi statistica dei dati

Dato che l’analisi dei dati richiede capacità di calcolo, il corso legherà strettamente sia gli aspetti teorici che quelli implementativi, integrando cioè la teoria con la pratica di eseguire al calcolatore gli stessi concetti

Gli esercizi sono quindi parte integrante del corso

Imparare l’uso di un linguaggio e software di analisi dati (R + RStudio) è parte integrante del corso

Modalità d’esame

L’esame è in due parti, tipicamente nello stesso giorno

  • prova pratica (mattina): sulla piattaforma Moodle esamionline vengono proposti una serie di esercizi in R
  • Ogni esercizio ha un punteggio prefissato
  • Gli esercizi vengono corretti automaticamente con revisione manuale per quelli che risultano errati. Il voto massimo è 26/30
  • prova orale (pomeriggio): per chi desidera migliorare il voto (fino al massimo di 30/30L). L’orale può anche peggiorare il voto della prova pratica

Non è possibile sostenere l’orale in una sessione differente dalla prova pratica

Modalità d’esame (A.A. 2024–25)

ATTENZIONE: questo corso è il secondo (o il primo) di due moduli: l’esame è quindi solo una prova parziale e non viene verbalizzato

Il voto finale verrà verbalizzato solo dopo aver superato entrambi i moduli, inclusa cioè:

  • studenti del secondo anno: la prova parziale del primo modulo (prof. Bertolazzi)
  • studenti del terzo anno: la prova parziale del secondo modulo (prof. De Cecco).

Ricordarsi di iscriversi anche all’appello di registrazione!

Argomenti del corso

  1. Statistica descrittiva e inferenziale: descrivere il comportamento di variabili aleatorie e effettuare previsioni probabilistiche
  2. Introduzione a R e RStudio
  3. Regressione: adattare un modello analitico ad una serie di dati sperimentali
  4. Tecniche di Bootstrap: analisi dell’incertezza
  5. Taratura di sistemi di misura e stima dell’incertezza
  6. Design of Experiments: progettazione efficiente delle campagne sperimentali
  7. Serie temporali: analisi e previsione di variabili aleatorie tempo-dipendenti

Materiale didattico