Calcolo delle probabilità

#1  Nella voce Il concetto di probabilità abbiamo introdotto il tema di cui ci occuperemo qui.  Prima di andare avanti affrontiamo alcuni esercizi per riprendere gli argomenti già sviluppati.

1 testo e soluzione2 testo e soluzione3 testo e soluzione4 testo e soluzione5 testo e soluzione.

#7  Rispetto alla voce precedente, precisiamo meglio che cosa sono gli eventi.

   Chiamo fenomeno (o esperimento) casuale un fenomeno determinato da molti fattori alcuni dei quali li so valutare (so individuarli, ho gli strumenti per misurarli, non è troppo dispendioso rilevarli, … – nel caso del lancio del dado potrebbero essere le caratteristiche fisiche del dado), altri li ritengo casuali (nel caso del dado: l'impulso che gli dò, la rugosità e l'inclinazione della superficie della tavola, la presenza di correnti d'aria, …). La distinzione tra fattori casuali e non casuali è soggettiva, dipende dallo stato di conoscenze, dal tempo e dalle risorse che voglio dedicare all'analisi del problema, … : disponendo di strumenti sofisticati potrei misurare l'impulso che dò al dado, valutare la presenza di correnti d'aria, ….
    Chiamo condizioni l'insieme dei fattori che riesco a valutare. A parità di condizioni (ad es. usando sempre un dado della stessa forma, dello stesso materiale, …), un fenomeno casuale può realizzarsi diversamente; in altre parole, più prove dell'esperimento possono dar luogo a risultati diversi.
    Chiamo deterministico un fenomeno che non dipende da fattori casuali.
    Un evento è un fatto che riguarda un fenomeno casuale; ogni volta che, a parità di condizioni, il fenomeno si realizza, l'evento può verificarsi o no: nel contesto del lancio di un dado, un evento può essere, lanciato un dado, "esce la faccia del dado con 4 pallini"; nel contesto delle "insufficienze" un esempio di evento è, preso uno studente alla fine del 1° quadrimestre, "lo studente è insufficiente in matematica e non in fisica".
    Passando al modello matematico:

•  rappresentiamo il fenomeno individuando uno o più oggetti matematici che rappresentino le grandezze o gli aspetti attraverso cui si manifesta il fenomeno; li indichiamo con dei nomi, così come si fa per le variabili nelle formule che descrivono fenomeni deterministici; per questo essi sono chiamati variabili casuali;
  gli eventi vengono rappresentati mediante formule (eventualmente combinate con operatori logici) in cui compaiono variabili casuali riferite al fenomeno in questione:
 nel caso del lancio di una coppia di dadi posso considerare i numeri U1 e U2 pari alle quantità dei pallini che compaiono sulle facce superiori dopo il lancio e rappresentare il fatto che "venga 7" con U1+U2=7
 nel caso delle insufficienze posso indicare con S lo studente e scrivere S∈M AND NOT S∈F per indicare l'evento "lo studente è insufficiente in matematica e non in fisica"

Esercizio   (soluzione)

Nota.  Le variabili casuali possono essere di tipo qualitativo o di tipo quantitativo. La distinzione non è però netta. Proviamo a precisarla.  Se consideriamo l'altezza delle persone di una certa popolazione, possiamo sicuramente considerarla come una variabile quantitativa:  ad ogni altezza associamo un numero o, meglio, un intervallo di numeri reali (dire che una persona è altra 176 cm significa che la sua altezza in centimetri sta tra 175.5 e 176.5).  Se consideriamo il primo arrivato ad una corsa in cui i concorrenti sono individuati con dei numeri non possiamo considerarla una variabile quantitativa:  i numeri sono semplicemente dei nomi usati per individuare i singoli concorrenti; possiamo considerarla una variabile qualitativa.  Questo semplice esempio pone però già qualche problema: se i numeri fossero assegnati ai concorrenti non a caso ma, ad esempio, tenendo conto della loro "bravura" (valutata ad esempio sulla base delle loro prestazioni dell'ultimo anno), potremmo individuare una qualche "relazione d'ordine".  Per un esempio più esplicito consideriamo i numeri 0, 1, 2, 3 usati per classificare il livello della attività sportiva fatta da degli individui intervistati, classificata attraverso degli opportuni criteri più o meno definiti.  Non si tratta di una misura "fisica", però si tratta di dati che ha senso ordinare, e di cui, sotto opportune ipotesi, si possono anche trovare i valori medi.  Questa è una variabile qualitativa o quantitativa?  Considerazioni analoghe possono essere fatte, ad esempio, per i colori:  in molti casi possono essere assunti come variabili qualitative, ma in altri possono essere considerati quantitative, quando, ad esempio, vengono impiegati per rappresentare altitudini, densità, frequenze, … diverse utilizzando la loro codifica numerica ( colori).  In definitiva, una distinzione netta non può essere fatta in assoluto: dipende dal tipo di analisi a cui si vogliono sottoporre i dati.  Nel caso degli esempi semplici considerati nella scheda "il concetto di probabilità" posso comunque dire che mentre E nel secondo è una variabile quantitativa nel primo è una variabile qualitativa.

#8  Se U è una variabile casuale a cui si è associato, come insieme di valori su cui può variare, un insieme di oggetti matematici {a1,a2,a3,…}, dotare U di una legge di distribuzione vuol dire descrivere come calcolare i valori di una misura di probabilità Pr per gli eventi U = ai.

  Nel caso del lancio di un dado, indicata con U l'uscita, posso associare a U come insieme di valori possibili l'insieme finito {1,2,…,6} e, se ipotizzo che il dado sia equo, considerare la misura di probabilità Pr così definita per ogni h in {1,2,…,6}:  Pr(U=h) = 1/6. Posso rappresentare tale legge di distribuzione anche un istogramma.
    In questo caso ho dotato U di una legge di distribuzione uniforme sull'insieme {1,2,…,6}.

 

    Per calcolare Pr(U è pari) invece di procedere come ho fatto in precedenza, posso osservare che l'esito di sommare 1/6 tante volte quanti sono i casi "favorevoli" (cioè 3 volte, quanti sono i numeri pari) è pari a 3/6.
    Analogamente, nel caso di U distribuita uniformemente su un insieme finito di n elementi, se so che un evento A equivale all'uscita di uno tra k elementi, si dice che i casi possibili sono n, i casi favorevoli sono k e Pr(A) può essere calcolata facendo k / n.
  Supponiamo di lanciare ripetutamente una moneta fino a che non esce "testa" (T). Vogliamo valutare il numero N dei lanci necessari. In questo caso i valori che può assumere N non sono in quantità finita, come invece accadeva per U nell'esempio precedente: sarà N=1 se esce T al primo lancio, N=2 se esce T al secondo lancio, …. Non esiste un limite superiore al valore che può assumere N: la moneta potrebbe essere truccata in modo tale che non esca mai T, o, anche se essa fosse equa, potrebbe capitare che esca sempre "croce" (C) per una lunga sequenza di lanci, senza che a priori si possa stabilire quanto sia questa lunghezza.
    Proviamo a valutare Pr(N=2) nel caso in cui la moneta sia equa. Al primo lancio al 50% (cioè con probabilità 1/2) esce T, e mi fermo, e al 50% esce C, e proseguo; quindi Pr(N=1)=50%. Se effettuo un secondo lancio ho nuovamente che possono uscire con la stessa probabilità sia T (nel qual caso mi fermo: N=2) che C (nel qual caso proseguo: N>2). Quindi Pr(N=2) è la metà di 50%, cioè 25%.
    Analogamente l'evento N=3 equivale all'uscita di T al terzo lancio, ed ha probabilità metà di 25%, cioè 12.5% (1/8). Più k è grande; più Pr(N=k) è piccolo: ad ogni incremento di 1 di k Pr(N=k) si dimezza. Il fatto che siano necessari 5 lanci è poco probabile (Pr(N=5) = 1/2/2/2/2/2 = 3.125%), ma non impossibile.

#9  Se invece a U è associato, come insieme di valori su cui può variare, un intervallo I di numeri, dotare U di una legge di distribuzione vuol dire descrivere come calcolare i valori di una misura di probabilità Pr per gli eventi del tipo U∈J con J sottointervallo di I.

   Nel caso dell'esempio della età di laurea E, l'assunzione che E si distribuisca come nel box-plot raffigurato alla voce percentili è traducibile così:

Pr(E ≤ 24.5) = 5%,  Pr(E ≤ 26.5) = 25%,  Pr(E ≤ 27.5) = 50%,  Pr(E ≤ 29.4) = 75%,  Pr(E ≤ 34.5) = 95%.

    In questo caso, usando le proprietà di Pr sono in grado di valutare probabilità di vari eventi del tipo E∈J con J sottointervallo di [0,∞), anche se non di tutti:  so calcolare Pr(E∈(26.5, 34.5]) (= 95%–25% = 70%) ma non so calcolare Pr(E∈[28, 32)).
    Se invece avessi a disposizione le informazioni fornite dall'istogramma raffigurato sopra al box-plot, potrei valutare Pr(E∈J) per tutti gli intervalli J del tipo [m,n) con m e n interi. Ad esempio per Pr(E∈[28, 32)) potrei ricavare le probabilità che E cada in [28,29), [29,30), [30,31), [31,32) e sommarle, ottenendo 32%.

#10  Il generatore di numeri pseudocasuali (random() in JavaScript, Randomreal[] in WolframAlpha, nomi simili in altre applicazioni), è una "funzione a 0 argomenti" presente nei linguaggi di programmazione (e nei fogli di calcolo e in molto software matematico) che (ogni volta che è incontrata nel corso dell'esecuzione) assume un valore che cade in [0,1) con legge di distribuzione uniforme.
    In questo caso ciò significa che, presi comunque due sottointervalli J e K di [0,1) di uguale ampiezza, Pr(Rnd∈J) = Pr(Rnd∈K), dove con Rnd abbiamo indicato le uscite della funzione "generatore di numeri pseudocasuali".  Rnd è usabile per simulare altre variabili casuali (ossia creare degli oggetti matematici che si comportino come esse).

    Usiamo ad esempio "calcolatrice2" presente QUI.  Se metto floor(random()*6)+1 ("floor" è il troncamento agli interi) ottengo l'uscita di un dado "equo".  Altro esempio:

    Ricliccando [=] ho le uscite di successivi "lanci" di due dadi equi.

    Si chiamano "pseudocasuali" e non "casuali" in quanto la casualità è apparente: in realtà il funzionamento di Rnd è governato da un sottoprogramma incorporato nel programma traduttore (pseudo è un prefisso di origine greca che significa "falso", "fittizio", come in "pseudonimo" = "falso nome", "pseudoscientifico" = "presentato falsamente come scientifico").

Ad esempio per valutare la probabilità che lanciando due dadi si ottenga un'uscita maggiore di 7 possiamo impiegare il seguente programma in JavaScript:

n=1e2; t=0; for(i=0; i<n; i=i+1)
  if(Math.floor(Math.random()*6)+Math.floor(Math.random()*6)+2 > 7) t=t+1
document.write(t/n)
n=1e5; t=0; for(i=0; i<n; i=i+1)
  if(Math.floor(Math.random()*6)+Math.floor(Math.random()*6)+2 > 7) t=t+1
document.write("
",t/n) n=1e8; t=0; for(i=0; i<n; i=i+1) if(Math.floor(Math.random()*6)+Math.floor(Math.random()*6)+2 > 7) t=t+1 document.write("
",t/n) Output: 0.46 0.41895 0.41664743

    La frequenza tende a stabilizzarsi intorno a 0.41666…. In questo caso è facile determinare la probabilità anche per via teorica:  le "possibili" coppie di uscite, tra loro equiprobabili se i dadi sono equi, sono 6·6 = 36  – (1,1), (1,2), …, (1,6), (2,1), …, (2,6), …, (6,6) –  mentre quelle "favorevoli", che danno luogo ad un numero maggiore di 7, sono 1+2+3+4+5 = 15  – (2,6), (3,5), (3,6), (4,4), (4,5), (4,6), …, (6,6) –  per cui la probabilità è 15/36 = 5/12 = 0.41666….

    Rappresentiamo la cosa con una tabella in cui indichiamo le uscite di U1+U2 se U1 e U2 sono quelle dei due dadi.  L'uscita più probabile è 7, in quanto si può formare in più modi.  Le parti in giallo scuro (15 su 36) corrispondono all'evento U1+U1 > 7.  Sono 15/36 = 5/12.
   
U2=1U2=2U2=3U2=4U2=5U2=6
U1=1  2 3 4 5 6 7
U1=2 3 4 5 6 7 8
U1=3 4 5 6 7 8 9
U1=4 5 6 7 8 9 10
U1=5 6 7 8 9 10 11
U1=6 7 8 9 10 11 12

    Ritorneremo più avanti sui modi in cui utilizzare il computer.

#11  Spesso si tende ad affrontare ogni problema probabilistico cercando di calcolare un rapporto del tipo: "casi favorevoli" su "casi possibili", a cui, come abbiamo visto sopra, si può ricorrere nel caso di distribuzioni finite ed uniformi.  Ma a volte lo si fa erroneamente.
    Ad esempio c'è chi può pensare che la probabilità di fare 4 lanciando due dadi sia 1/11, in quanto 4 è 1 tra le 11 uscite possibili (2, 3, …, 12).  Facendo così non tiene conto che le 11 uscite non sono tutte equiprobabili.  O c'è chi può pensare che sia 2/36, in quanto 4 posso ottenerlo se escono due 2 o se escono un 1 e un 3 (2 casi favorevoli) mentre i possibili esiti di un lancio sono dati da 6 possibili uscite per il primo dado a ciascuna delle quali possono corrispondere 6 uscite diverse del secondo (6 per 6 casi possibili).  Qui l'errore consiste nel non tener conto che l'uscita di un 1 e un 3 posso ottenerla in due modi: l'1 col primo dado e il 3 col secondo, o viceversa. I casi favorevoli sono dunque 3, non 2.
    In altre situazioni non si tiene conto che questo schema di calcolo funziona solo se la distribuzione è uniforme, come quando un insegnante decide di interrogare tra i suoi 18 alunni quello il cui numero d'ordine sul registro di classe è dato dalla somma delle cifre della pagina di un libro aperto a caso, supponiamo senza privilegiare alcuna parte del libro  (una pagina verso l'inizio abbia la stessa probabilità di essere pescata di una centrale o una finale).  L'insegnante pensa che ogni alunno abbia 1/18 come probabilità di essere chiamato.  Ma … se per es. il libro ha 100 pagine, il primo e il secondo alunno hanno probabilità 3/100 = 3% di essere sorteggiati (pagine 1, 10, 100 per il 1°, pagine 2, 11, 20 per il 2°), il 3° 4% (3, 12, 21, 30), … il 18° 1% (99).  Il più sfortunato è l'alunno n. 9, con il 10% di probabilità di essere pescato.
    Vi sono, poi, volte in cui si accetta acriticamente che una distribuzione sia uniforme.  Consideriamo ad esempio due dadi di carta realizzati utilizzando materiali e indicazioni presenti in un giornalino per bambini (vedi la figura seguente).  Se ammettiamo che la distribuzione delle 6 uscite sia uniforme, possiamo concludere che lanciando due dadi si hanno le stesse probabilità di ottenere 2 (1+1) e 12 (6+6).  È corretta questa ipotesi?

    Come si vede nella figura sopra a destra, mentre sulla faccia "1" sono incollate 3 linguette, sulla faccia "6" non ve ne sono: lanciando un dado è più facile che esca 6 in quanto la sua faccia opposta è più pesante.  In effetti se si costruiscono i dadi si può verificare sperimentalmente che il 6 esce con frequenza più che doppia rispetto all'1, e che, quindi, lanciando due dadi ottenere 12 è abbastanza frequente mentre ottenere 2 è molto raro.  Vedi QUI le animazioni "dado non bilanciato" e "dadi non bilanciati".

#12  Gli errori discussi sopra sono in parte causati da confusioni concettuali originate da insegnamenti o libri di testo in cui la probabilità viene definita con frasi del tipo: «si chiama probabilità di un evento il rapporto tra il numero dei casi favorevoli al verificarsi dell'evento e il numero dei casi possibili, purché questi siano ugualmente possibili», scambiando per una definizione quello che è un metodo di calcolo applicabile solo sotto ipotesi molto restrittive.
Per  diversi aspetti questo è un errore più grave dei precedenti.  È un errore "didattico" poiché fonte dei fraintendimenti concettuali di cui abbiamo discusso (il "purché …" viene cancellato dalla memoria dagli esercizi ripetitivi in cui si fa poi applicare la definizione).  È un errore "tecnico" perché contiene un "circolo vizioso": definisce la probabilità utilizzando il concetto stesso di probabilità: si dice che i casi devono essere "equiprobabili"  (supponendo che sia questo che si vuole intendere con "egualmente possibili", perché, a rigore, l'aggettivo "possibile", a differenza dell'aggettivo "probabile", non dovrebbe essere quantificato).  Ed è un errore "concettuale", in quanto cattura solo situazioni molto particolari  (non si adatta, ad es., ai primi due esempi considerati nella scheda precedente, che corrispondono a situazioni molto comuni in cui si fanno valutazioni probabilistiche).

#13  Un errore di tipo diverso è quello di basarsi sugli esiti sperimentali di un fenomeno che si ripete (come il lancio di un dado, le uscite al gioco del lotto, …) anche quando si conosce la legge di distribuzione del fenomeno stesso e si sa che ogni nuovo evento accade in modo del tutto indipendente dai precedenti (si usa un dado non truccato, le estrazioni del lotto sono effettuate senza imbrogli, …).  Ad es., riferendoci al gioco del lotto, se sulla ruota di Genova il 13 non esce da 50 estrazioni e il 17 non esce da 70, non c'è alcun motivo per ritenere che alla prossima estrazione sia più probabile l'uscita del 17 rispetto a quella del 13: entrambi hanno la stessa probabilità di uscita in quanto siamo di fronte a una distribuzione uniforme.  In una voce successiva è ulteriormente approfondito il concetto di  indipendenza tra due eventi.

#13  Consideriamo, infine, qualche esempio d'uso del software impiegabile nelle elaborazioni statistiche e probabilistiche.  Iniziamo con WolframAlpha (vedi):

BarChart (1,2,3,4,5,6,5,4,3,2,1)
RandomReal[ ]RandomReal[(5,10)] RandomReal[(5,10),3]RandomInteger[(1,6),10]
0.2023267.90608{8.57444, 9.28861, 6.15169}{5, 4, 3, 1, 1, 6, 2, 3, 1, 4}
Histogram[ RandomInteger[(1,6),500]+RandomInteger[(1,6),500],11 ]

#13  Esempio d'uso di script presenti QUI  (apri i file e vedi l'help o gli esempi):

istogramma    boxplot   boxplot cl    dado ... dadi    cbin    calcolatrice2    numeri casuali

Esercizi:     testo1 e soluz.,   testo2 e soluz.,   testo3 e soluz.,   testo4 e soluz.,   testo5 e soluz.,   testo6 e soluz.,
testo7 e soluz.,   testo8 e soluz.,   testo9 e soluz.,   testo10 e soluz.,   testo11 e soluz.,   testo12 e soluz.
Su "che cos'è la probabilità":     testo13 e soluz.,   testo14 e soluz.,   testo15 e soluz.,   testo16 e soluz.