Per studiare gli effetti di un certo virus, in uno studio scientifico 70 cavie sono state infettate con esso e si sono rilevati i loro giorni di sopravvivenza.  I dati sono riportati a lato.  Come potresti rappresentare queste informazioni in un modo più velocemente e più facilmente comprensibile?   
 40, 45, 53, 56, 56, 57, 58, 62, 64, 73, 74, 78, 79, 80,
 81, 81, 81, 82, 83, 83, 84, 85, 89, 90, 91, 92, 92, 97,
 99, 99, 99, 99,101,102,102,102,103,104,107,108,109,113,
114,118,121,123,126,128,137,138,134,144,145,147,156,162,
174,174,179,184,191,198,208,214,247,249,328,383,403,511

 40, 45, 53, 56, 56, 57, 58, 62, 64, 73, 74, 78, 79, 80,
 81, 81, 81, 82, 83, 83, 84, 85, 89, 90, 91, 92, 92, 97,
 99, 99, 99, 99,101,102,102,102,103,104,107,108,109,113,
114,118,121,123,126,128,137,138,134,144,145,147,156,162,
174,174,179,184,191,198,208,214,247,249,328,383,403,511
       Un modo semplice e breve è quello di prendere come rappresentante dei dati (che sono già in ordine di grandezza) quello che sta, più o meno, a metà, ossia 102, e, per avere un'idea di come sono distribuiti i dati, prendere da una parte quello che sta, circa, a metà della prima metà, ossia 81, e dall'altra quello che sta a metà della seconda metà, ossia 144.  Quindi possiamo dire che i dati sono attorno a 102, e che il 50% di essi sta tra 81 e 144.  Ricordiamo che il dato che sta a metà dell'elenco ordinato dei dati si chiama mediana.

    Volendo fare un calcolo complicato si potrebbe fare la media dei dati, ottenendo 129.6, ma si tratta di una informazione poco significativa: è distante dal valore centrale (102) in quanto i dati maggiori di quello che sta a metà si disperdono maggiormente di quelli minori.

    Riportando i dati in ordine, raggruppati in classi ampie 50 giorni, possiamo capire meglio come sono distribuiti i dati:

|40, 45,
|53, 56, 56, 57, 58, 62, 64, 73, 74, 78, 79, 80, 81, 81, 81, 82, 83, 83, 84, 85, 89, 90, 91, 92, 92, 97, 99, 99, 99, 99
101,102,102,102,103,104,107,108,109,113,114,118,121,123,126,128,137,138,134,144,145,147,
156,162,174,174,179,184,191,198,
208,214,247,249,
|
328,
383,403,
|
511

Potrei anche rappresentare gli stessi dati su carta quadrettata, ottenendo un istogramma simile a quello raffigurato qui a destra.  Questa è decisamente la rappresentazione migliore, più facilmente comprensibile.
 

 
Posso rappresentare tutto più facilmente usando lo script "istogramma" presente QUI.  Vedi qua sotto.

   
    L'istogramma a quadretti rappresentato qui a sinistra è stato ottenuto con questo script.
dati = [2,30,22,8,4,0,1,2,0,1]
N = 30
G = [5,10,15,20,25,30]
titolo=""

C'è una rappresentazione alternativa agli istogrammi, su cui si tornerà negli studi successivi: invece di figure in due dimensioni figure in una dimensione.  Sono i box-plot, diagrammi dalla forma di "scatola", in cui la parte centrale rappresenta il 50% centrale dei dati, suddivisa in due parti da una tacca che rappresenta la mediana.  Ecco che cosa si può ottenere con lo script "box-plot":

È anche questa una rappresentazione che illustra efficacemente e in modo comprensibile la distribuzione dei dati, occupando poco spazio.