Matematica finanziaria e Statistica
Unità didattiche
La distribuzione binomiale 
di Rocco Fazio
Obiettivo : studiare la distribuzione binomiale mettendone in evidenza le proprietà.
Prerequisiti :
- variabili aleatorie;
- funzione di densità e di ripartizione di una v.a.;
- distribuzione normale;
- i coefficienti binomiali.
Sviluppo dell'unità.
Sia E un evento che ha la probabilità p di verificarsi; nell'esecuzione di n prove indipendenti, il numero delle volte in cui l'evento si verifica – ossia dei successi - è una variabile aleatoria X i cui valori sono 0, 1, 2,...., n.
La probabilità che ha X di assumere il valore x è data dalla formula
![]()
Perciò la seguente tabella
| X | 0 |
1 |
2 |
.... |
n |
| P | P 0 |
P 1 |
P 2 |
.... |
P n |
rappresenta la distribuzione di una variabile casuale discreta che prende il nome di distribuzione binomiale o bernoulliana; il numero n delle prove e la probabilità p si dicono parametri della distribuzione.
Definiamo con la TI 92 la funzione binom(n,x,p), che restituisce i valori delle probabilità e verifichiamo (nel caso particolare n=7 - ad esempio -) che risulta
:

La distribuzione binomiale è crescente se, ossia per x < np - q. Si possono presentare diversi casi, a seconda del valore assunto dalla differenza np - q; illustriamoli con alcuni esempi approfittando delle capacità grafiche e di calcolo della nostra calcolatrice.
Esempio 1. Consideriamo il classico esperimento del lancio di un dado (ovviamente non truccato) n=4 volte e studiamo la variabile aleatoria X = " numero delle uscite del numero 6 "; ecco la determinazione dei valori delle probabilità:

e il relativo grafico della distribuzione:

Come è ovvio, la distribuzione è sempre decrescente ed assume il valore massimo
per x=0; in questo caso il termine np-q è negativo; un risultato simile si ottiene per n=5, con np-q=0:

Esempio 2. Consideriamo ora una variante dell'esempio precedente: studiamo la distribuzione della variabile aleatoria X = " numero delle uscite di un numero >2 " nel lancio di un dado n=6 volte. La distribuzione è la seguente:

e la relativa rappresentazione grafica è:

In questo caso è
e il valore massimo si ottiene in corrispondenza di x=4.
Si noti che comincia a comparire una certa simmetria.
Esempio 3. Consideriamo ora una serie di n lanci consecutivi di una moneta e la variabile aleatoria X = " numero delle uscite di una 'testa' ". Vediamo la rappresentazione grafica per n=4, n=5 ed n=8: la simmetria è ora perfetta.

È questa una proprietà molto importante: per
la curva rappresentativa della distribuzione binomiale è simmetrica. Ma ciò che è ancora più importante è che per qualsiasi valore di p la curva tende a diventare simmetrica per n abbastanza grande.
Esempio 4. Un'azienda dispone di n macchinari identici per la produzione; sapendo che ciascuno di questi macchinari ha la probabilità p di essere guasto, studiare la variabile aleatoria X= " numero dei macchinari guasti contemporaneamente ". Studiare il problema per diversi valori di n e di p.
Per p=0.2 si ottengono le seguenti curve con n=5, n=10 ed n=15:

Per p=0.4 la situazione è la seguente:

Infine per p=0.7 si hanno i seguenti grafici:

Risulta evidente, da quanto si è mostrato, che per valori di p diversi da
la distribuzione binomiale tende ad acquistare simmetria per n "abbastanza grande", e che le cose volgono più rapidamente al meglio se p è prossimo a.
Si può anche costruire la funzione di ripartizione della distribuzione binomiale:

Ecco la tabulazione dei valori della funzione di ripartizione e il grafico della distribuzione binomiale dell'esempio 3 (caso n=5):




Possiamo ora calcolare il valor medio e la varianza della distribuzione binomiale. Come per tutte le distribuzioni discrete di probabilità, il valor medio è dato da
; per determinarlo possiamo costruire la funzione MEDPES che acquisisce in input due liste e calcola la media pesata degli elementi della prima lista considerando come pesi gli elementi della seconda:
medpes(valori,pesi)
Func
(valori[i]*pesi[i],i,1,dim(pesi))/(
(pesi[i],i,1,dim(pesi)))
EndFunc

È immediato verificare che il valor medio della binomiale è proprio np=
; tuttavia potremo usare la nostra funzione per calcolare il valor medio di una qualunque variabile aleatoria discreta.
Eseguiamo ora il calcolo della varianza:

Possiamo anche verificare la proprietà
e che la varianza della binomiale è n p q:

Il calcolo della probabilità della distribuzione binomiale è proibitivo per n grande (talvolta anche per la TI 92); viene allora in aiuto il teorema di de Moivre-Laplace che afferma che una distribuzione binomiale, per n abbastanza grande, tende a comportarsi come una distribuzione gaussiana. Più precisamente, se n p ed n p q sono la media e la varianza di una distribuzione binomiale, questa può essere approssimata da una distribuzione gaussiana con la stessa media e la stessa varianza.
Cerchiamo di approfittare delle capacità di calcolo della nostra calcolatrice e confrontiamo una distribuzione binomiale con n=20 e
con la distribuzione normale di media
e varianza. A questo scopo definiamo la funzione normale(s,m,x), che fornisce i valori della nota funzione
:

Confrontiamo ora il grafico della binomiale con quello della gaussiana procedendo nel modo seguente:
- in DATA/MATRIX EDITOR costruiamo i valori della binomiale:
- con F2 – PLOT SETUP e successivamente F1 – DEFINE definiamo il grafico rappresentativo dei dati della tabella:

- in Y=EDITOR definiamo la funzione gaussiana:

- impostiamo la finestra in maniera adeguata:

- ed infine tracciamo i due grafici (quello continuo è ovviamente della gaussiana):

Come vediamo l'adattamento è notevole, ma il grafico non ci tragga in inganno: l'errore c'è anche se non si vede! Per valutarlo è sufficiente tabulare il valore le differenze assolute fra i valori e rappresentarle graficamente:



Si può anche stabilire che per n=5 si ottiene l'errore massimo pari a circa 7 millesimi. Un'analisi teorica degli errori di approssimazione della binomiale con la normale è piuttosto complessa; tuttavia effettuando uno studio "sperimentale" con i metodi sopra descritti si può verificare che quando la media è distante sia da 0 che da n si hanno buoni risultati.
Commenti sull'argomento
Se sei un iscritto a Cartesio puoi lasciare il tuo commento su questo argomento. Per iscriverti, clicca qui.
Al momento non ci sono commenti.



