Uno studente misura un certo voltaggio dieci volte ottenendo i seguenti valori, in volt:  0.83, 0.86, 0.83, 0.89, 0.95, 0.88, 0.85, 0.82, 0.84, 0.87.  Tutte le misure sono attendibili?  Prova a rispondere e ad argomentare la risposta.

Prima di metterci a fare conti, osserviamo i dati, che sono abbastanza pochi. Vediamo subito che c'è un dato (0.95) che si scosta dagli altri. Capiamo meglio come sono distribuiti i dati se li ordiniamo:

0.82, 0.83, 0.83, 0.84, 0.85, 0.86, 0.87, 0.88, 0.89, 0.95

I primi 9 dati distano l'uno dall'altro al più di un cenetsimo, mentre l'ultimo, 0.95, dista dal precedente di 0.6.

Un dato che, in una collezione di dati, sia sostanzialmente diverso dagli altri viene chiamato, in statistica, outlier (da "out", fuori, e "to lie", stare, trovarsi; la parola viene usata anche per indicare una persona solitaria).  Per fare un altro esempio, nel caso dei dati rappresentati dall'istogramma raffigurato qui a destra il dato -6 è un outlier.

Tornando al nostro caso, è abbastanza ragionevole ritenere che 0.95 sia frutto di un errore di misurazione e, quindi, sia da scartare.

     

Usando il computer, potremmo ordinare i dati e fara una prima valutazione statistica con lo script "add mol med" presente QUI:
8.62 = sum of 0.83,0.86,0.83,0.89,0.95,0.88,0.85,0.82,0.84,0.87
media = 8.62/10 = 0.862
numero dati=10; al centro: 0.85 (e 0.86); 1^,3^ quartile: 0.83, 0.88; in ordine:
0.82,0.83,0.83,0.84,0.85,0.86,0.87,0.88,0.89,0.95

Nota. A volte, in statistica, si usa la convenzione di considerare "outlier" un dato abbastanza isolato che stia fuori dall'intervallo [1º quartile, 3º quartile] e disti da esso almeno 1.5 volte la sua sua ampiezza. Nel nostro caso 1º e 3º quartile sono 0.83 e 0.88 e la distanza tra essi è 0.5; 0.5×1.5 = 0.75; 0.95-0.88 = 0.7; quindi, se si usasse questo criterio, 0.95 sarebbe un dato sospetto.

In ogni caso conviene rieffettuare le misurazioni. Se non è possibile si può eliminare il dato; otterremmo quanto segue, con una media abbastanza diversa:
7.67 = sum of 0.83,0.86,0.83,0.89,0.88,0.85,0.82,0.84,0.87
media = 7.67/9 = 0.8522222222222222   (arrotondando, 0.852)
numero dati=9; al centro: 0.85; 1^,3^ quartile: 0.83, 0.87; in ordine:
0.82,0.83,0.83,0.84,0.85,0.86,0.87,0.88,0.89