Ecco i battiti cardiaci (numero dei battito al minuto) registrati tra gli studenti, maschi e femmine, di un corso universitario:
M:   64, 58, 62, 66, 64, 74, 84, 68, 62, 76, 90, 80, 92, 68, 60, 62, 66, 70, 68, 72, 70, 74, 66, 70, 62, 60, 72, 62, 76, 68, 54, 74, 74, 68, 72, 68, 82, 64, 58, 54, 70, 62, 48, 76, 88, 70, 90, 78, 70, 90, 92, 60, 72, 68, 84, 74, 68
F:   96, 62, 78, 82, 100, 68, 96, 78, 88, 62, 80, 84, 61, 64, 94, 60, 72, 58, 88, 66, 84, 62, 66, 80, 78, 68, 72, 82, 76, 87, 90, 78, 68, 86, 76

Esamina statisticamente le due sequenze di dati e valutane opportunamente le differenze usando strumenti elementari (media, mediana, percentili, ...).

Posso ad esempio ordinare i dati relativi ai maschi e alle femmine, e trovare la mediana (dato al centro dei dati ordinati) per le femmine (78) è maggiore che per i maschi (70):

Posso confrontare le medie, tenendo comunque conto che il numero delle femmine è minore di quello dei maschi.  F: somma = 2690, media = 2690/35 = 76.86.  M: somma = 4014, media = 4014/57 = 70.42.

Oltre alla mediana (50º percentile) possiamo confrontare il primo quartile (25º percentile) e terzo quartile (75º percentile):
F:  1º quartile = 66,  2º quartile = 78,  3º quartile = 86;   M:  1º quartile = 62,  2º quartile = 70,  3º quartile = 74

Possiamo, poi, confrontare meglio, graficamente, questi valori (minimo, 1º, 2º e 3º quartile, massimo) con dei box-plot:

Potremmo fare anche gli istogrammi, ma quest'ultima rappresentazione è decisamente più efficace.

Questi dati sono in accordo con le statistiche realizzate su ampi campioni, da cui risulta che la pulsazione media maschile è di poco superiore ai 70 battiti al minuto e che quella femminile è di poco superiore ai 75 battiti al minuto.
 


Come sono stati fatti i calcoli e le rappresentazioni precedenti sopra riportate?  L'ordinamento dei dati è stato realizzato con lo script "ordina/" presente QUI.  Somme e medie posso ottenerle facilmente con lo script "istogramma" (usandolo solo per fare i calcoli).  I box-plot posso realizzarli con lo script "box-plot cl", che mi consente di rappresentare in una range [A,B] prefissato più boxplot di dati già classificati, in modo da poterli confrontare facilmente (scelgo A=45, B=105 in modo che A sia minore di tutti i dati di entrambe le sequanze e B sia maggiore di tutti).