Normalna raspodela

Izvor: Wikipedia
Gustina verovatnoće normalne raspodele sa različitim parametrima. Zelenom bojom je predstavljena normalna normirana raspodela.

Normalna raspodela ili Gausova raspodela, je važna familija neprekidnih raspodela verovatnoće, sa primenama u mnogim poljima. Članovi familije normalne raspodele su definisani preko dva parametra, matematičko očekivanje, i varijansa (disperzija) σ2. Normalna normirana raspodela je normalna raspodela sa očekivanjem jednakim nuli, i varijansom jednakom jedan (zelena kriva na slici desno). Karl Fridrih Gaus se dovodi u vezu sa ovim skupom raspodela, jer je pomoću njih analizirao astronomske podatke[1], i definisao jednačinu funkcije gustine raspodele normalne raspodele.

Važnost normalne raspodele kao modela kvantitativnih fenomena u prirodnim i društvenim naukama je posledica centralne granične teoreme. Mnoga psihološka merenja i fizički fenomeni se mogu dobro aproksimirati normalnom raspodelom. Iako su mehanizmi koji leže u osnovi ovih fenomena često nepoznati, upotreba modela normalne raspodele se teoretski opravdava pretpostavkom da mnogo malih, nezavisnih uticaja aditivno doprinose svakoj opservaciji.

Normalna raspodela se javlja i u mnogim oblastima statistike. Na primer, srednja vrednost uzorka ima približno normalnu raspodelu, čak i ako raspodela verovatnoće populacije iz koje se uzorak uzima nije normalna. Normalna raspodela je najčešće korišćena familija raspodela u statistici, i mnogi statistički testovi su bazirani na pretpostavci normalnosti. U teoriji verovatnoće, normalne respodele se javljaju kao granične raspodele više neprekidnih i slučajnih familija raspodela.

Definicija[uredi - уреди]

Slučajna promenljiva X sa raspodelom verovatnoće f:\R\to\R_{>0},\ x\mapsto f(x)

f(x) = \frac {1}{\sigma\sqrt{2\pi}}\exp\left(-\frac {1}{2} \left(\frac{x-\mu}{\sigma}\right)^2\right) [2]

ima normalnu raspodelu sa parametrima \mu, \sigma, što se piše kao X \sim \mathcal N(\mu, \sigma^2) ili (\mu,\sigma^2), gde je \mu matematičko očekivanje i \sigma standardna devijacija.

Funkcija raspodele verovatnoće normalne raspodele data je izrazom: F(x) = \frac{1}{\sigma\sqrt{2\pi}} \int_{-\infty}^x \exp\left(-\frac{1}{2} \left(\frac{t-\mu}{\sigma}\right)^2\right) \mathrm dt.

Funkcija raspodele verovatnoće standardne normalne raspodele \varphi_{0;1}(x)=\frac {1}{\sqrt{2\pi}} \cdot e^{-\frac {1}{2} x^2}

To je gustina verovatnoće za standardnu normalnu raspodelu (\mu=0,\ \sigma = 1). Intervali na rastojanju 1, 2 i 3 standardne devijacije od matematičkog očekivanja 0 zauzimaju 68 %, 95,5 % i 99,7 % površine ispod zvonaste krive. Isti procenti važe za svaku normalnu raspodelu, bez obzira na matematičko očekivanje i standardnu devijaciju. Treba primetiti da gustina normalne raspodele nikada ne dostiže 0, dakle važi f(x)>0 za sve realne vrednosti x.

Normalna raspodela je granični slučaj centralne granične teoreme koji nikada nije savršen u praksi. Međutim, konvergencija zbirne vrednosti slučajnih promenljivih raste vrlo brzo sa povećanjem broja promenljivih -{n}-. Zbir 30 ili 40 nezavisnih slučajnih promenljivih, koje pripadaju identičnom i proizvoljnom tipu raspodele verovatnoće, već je veoma blizak normalnoj raspodeli.

Osobine[uredi - уреди]

Simetrija[uredi - уреди]

Graf funkcije normalne raspodele  f:\R\to\R je zvonasta Gausova kriva, čija visina i širina zavisi od parametra  \sigma . Kriva je osno simetrična oko ose  x = \mu . Njena kumulativna funkcija F ima centralnu simetriju oko tačke P(\mu|0,5).

Maksimum i prevojne tačke funkcije raspodele verovatnoće[uredi - уреди]

Izračunavanjem prvog i drugog izvoda možemo izračunati maksimum i prevojne tačke funkcije normalne raspodele. Prvi izvod funkcije raspodele verovatnoće je

f'(x) = -\frac{x-\mu}{\sigma^2} f(x).

Maksimum se nalazi u tački x_\mathrm{max} = \mu, gde iznosi f_\mathrm{max} = \frac 1{\sigma\sqrt{2\pi}}.

Drugi izvod glasi:

f''(x) = \frac 1{\sigma^2}\left(\frac 1{\sigma^2}(x-\mu)^2-1\right) f(x).

Otuda zaključujemo da se prevojne tačke nalaze na koordinatama x=\mu\pm\sigma.

Normiranje[uredi - уреди]

Ukupna površina ispod Gausove zvonaste krive je tačno 1, što je odraz činjenice da je verovatnoća sigurnog događaja 1. Odatle sledi da od dve Gausove krive koje imaju isto \mu, ali različitu vrednost \sigma, ona sa većim \sigma je šira i niža nego ona druga. Dve Gausove krive sa sa jednakim \sigma i različitim \mu imaju grafike koji izgledaju istovetno, osim što su pomereni po x-osi za iznos razlike dve vrednosti \mu.

Normiranje Gausove krive se izvodi na sledeći način.

Definišimo

A := \lim_{x \to \infty} F(x) = \frac 1{\sigma \sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \left(\frac{t-\mu}\sigma\right)^2\right) \mathrm dt.

Da bi raspodela F bila normirana, mora važiti A = 1.

Integral ćemo uprostiti korišćenjem linearne supstitucije \tau = \frac{t-\mu}\sigma, a onda važi \tau'(t) = \frac 1\sigma

\begin{align}
 A &= \frac 1{\sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \tau(t)^2\right) \tau'(t) \mathrm dt\\
   &= \frac 1{\sqrt{2\pi}} \int_{-\infty}^\infty \exp\left(-\frac 12 \tau^2\right) \mathrm d\tau.
\end{align}

Kao što smo i očekivali, vrednost A je nezavisna od parametara \sigma i \mu.

Izračunavanje[uredi - уреди]

Direktna primena integrala za izračunavanje površine ispod Gausove krive nije moguća, jer se ona ne može svesti na elementarne funkcije poznatih integrala. Ranije su se za njeno izračunavanje koristile tabele. Danas je funkcija za izračunavanje ovog integrala dostupna na kalkulatorima i računarima. Tabele ovog integrala se ne daju za odabrane vrednost  \mu - i  \sigma , već samo za standardnu normalnu raspodelu sa parametrima  \mu=0 i  \sigma=1 (normirana normalna raspodela). Za ostale vrednosti ovih parametara potrebno je preračunavanje.

Tabele takođe daju vrednosti kumulativne funkcije verovatnoće  \Phi , poznate i kao Gausov integral greške:

\Phi(z)=\frac 1{\sqrt{2\pi}} \cdot \int_{-\infty}^z \mathrm{e}^{-\frac 12 t^2} \mathrm{d}t

Po analogiji, odgovarajuća normirana funkcija gustine verovatnoće  f označava se sa  \phi .

Matematičko očekivanje[uredi - уреди]

Normalna raspodela ima sledeće matematičko očekivanje

 \operatorname{E}(X) =\frac{1}{\sigma\sqrt{2\pi}}\int\limits_{-\infty}^{+\infty}x
                               \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\operatorname{d}x
                             = \mu.

Varijansa i standardna devijacija[uredi - уреди]

Vrednost varijanse normalne raspodele je

\operatorname{Var}(X) = \frac{1}{\sigma\sqrt{2\pi}}\int\limits_{-\infty}^{+\infty}(x-\mu)^2
                               \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\operatorname{d}x
                             = \sigma^2.

Za vrednost standardne devijacije dobijamo

\sqrt{\operatorname{Var}(X)} = \sigma.

Izvori[uredi - уреди]

  1. Havil, 2003
  2. Kod funkcije exp(x) radi se o eksponencijalnoj funkciji sa osnovom e, koja se predstavlja i kao e^x.


E-to-the-i-pi.svg Nedovršeni članak Normalna raspodela koji govori o matematici je u začetku. Dopunite ga prema pravilima Wikipedije.