Indici di dispersione in statistica

Tempo Di Lettura ~4 Min.
Gli indici di dispersione sono importanti perché descrivono la variabilità riscontrata in una determinata popolazione o campione. Ecco come usarli.

Nella distribuzione dei dati gli indici di dispersione giocano un ruolo molto importante. Queste misurazioni integrano quelle della cosiddetta posizione centrale caratterizzando la variabilità dei dati.

IL indici di dispersione complementare quelli di tendenza centrale. Sono anche essenziali nella distribuzione dei dati. Questo perché ne caratterizzano la variabilità. La loro rilevanza nella formazione statistica è stata evidenziata da Wild e Pfannkuch (1999).

La percezione della variabilità dei dati è una delle componenti basilari del pensiero statistico poiché ci fornisce informazioni sulla dispersione dei dati rispetto ad una media.

L'interpretazione della media

IL media aritmetica è ampiamente utilizzato nella pratica ma spesso può essere interpretato erroneamente. Ciò accade quando i valori delle variabili sono molto scarsi. In queste occasioni è necessario accompagnare gli indici medi di dispersione (2).

Gli indici di dispersione hanno tre componenti importanti legate alla variabilità casuale (2):

  • La percezione della sua ubiquità nel mondo che ci circonda.
  • Il concorso per la sua spiegazione.
  • La capacità di quantificarla (che implica comprendere e saper applicare il concetto di dispersione).

A cosa servono gli indici di dispersione?

Quando è necessario generalizzare i dati di un campione di una popolazione gli indici di dispersione sono molto importanti poiché influenzano direttamente l'errore con cui lavoriamo . Maggiore è la dispersione che raccogliamo in un campione, maggiore è la dimensione necessaria per lavorare con lo stesso errore.

D'altra parte questi indici ci aiutano a determinare se i nostri dati sono lontani dal valore centrale. Ci dicono se questo valore centrale è adeguato a rappresentare la popolazione oggetto dello studio. Questo è molto utile per confrontare distribuzioni e comprendere rischi nel processo decisionale (1).

Questi rapporti sono molto utili per confrontare le distribuzioni e comprendere i rischi nel processo decisionale. Maggiore è la dispersione, meno rappresentativo è il valore centrale .

Quelli più utilizzati sono:

Funzioni degli indici di dispersione

Allineare

L'uso del rango è per il confronto primario. In questo modo considera solo le due osservazioni estreme . Questo è il motivo per cui è consigliato solo per campioni piccoli (1). È definito come la differenza tra l'ultimo valore della variabile e il primo (3).

Deviazione statistica

La deviazione media indica dove si concentrerebbero i dati se tutti fossero alla stessa distanza dalla media aritmetica (1). Consideriamo la deviazione di un valore variabile come la differenza in valore assoluto tra quel valore variabile e la media aritmetica della serie. Viene quindi considerata come la media aritmetica degli scostamenti (3).

Varianza

La varianza è una funzione algebrica di tutti i valori appropriato per compiti statistici inferenziali (1). Può essere definita come deviazione quadratica (3).

Deviazione standard o tipica

Per campioni prelevati dalla stessa popolazione la deviazione standard è una delle più utilizzate (1). È la radice quadrata della varianza (3).

Coefficiente di variazione

È una misura utilizzata principalmente per confrontare la variazione tra due insiemi di dati misurati in unità diverse E. Per esempio altezza e peso corpo di studenti in un campione. Viene utilizzato per determinare in quale distribuzione i dati sono maggiormente raggruppati e la media è più rappresentativa (1).

Il coefficiente di variazione è un indice di dispersione più rappresentativo dei precedenti poiché è un numero astratto. In altre parole è indipendente dalle unità in cui compaiono i valori delle variabili. In generale questo coefficiente di variazione è espresso in percentuale (3).

Conclusioni sugli indici di dispersione

Gli indici di dispersione indicano da un lato il grado di variabilità del campione. D'altra parte, la rappresentatività del valore centrale poiché se ottieni un valore basso significa che i valori sono concentrati attorno a quel centro. Ciò significherebbe che c’è poca variabilità nei dati e il centro li rappresenta tutti bene.

Al contrario, se si ottiene un valore alto significa che i valori non sono concentrati ma sparsi. Ciò significa che c’è molta variabilità e il centro non sarà molto rappresentativo. D'altra parte, quando facciamo inferenze, se lo desideriamo, avremo bisogno di un campione più ampio ridurre l'errore aumentato proprio a causa dell’aumento della variabilità.

Messaggi Popolari