Diferența dintre deviația standard și media

Anonim

Deviația standard vs media

În statisticile descriptive și inferențiale, mai mulți indici sunt utilizați pentru a descrie un set de date corespunzător tendința sa centrală, dispersia și îngrijorarea. În inferența statistică, acestea sunt cunoscute în mod obișnuit ca estimatori deoarece ei estimează valorile parametrilor populației.

tendința centrală se referă la și localizează centrul distribuției valorilor. Media, modul și mediana sunt indicii cei mai frecvent utilizați în descrierea tendinței centrale a unui set de date. Dispersia este cantitatea de răspândire a datelor din centrul distribuției. Intervalul și abaterea standard sunt cele mai frecvent utilizate măsuri de dispersie. Coeficienții de zgomot al lui Pearson sunt utilizați pentru a descrie decalajul unei distribuții de date. Aici, skewness se referă la faptul dacă setul de date este simetric cu privire la centru sau nu și, dacă nu, cât de înclinat este.

Ce înseamnă?

Media reprezintă indicele cel mai frecvent utilizat al tendinței centrale. Dat fiind un set de date, media se calculează luându-se suma tuturor valorilor datelor și apoi împărțind-o cu numărul de date. De exemplu, greutatea a 10 persoane (în kilograme) este măsurată la 70, 62, 65, 72, 80, 70, 63, 72, 77 și 79. Apoi, greutatea medie a celor zece persoane (în kilograme) calculată după cum urmează. Suma greutăților este de 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Media = (sumă) / (număr de date) = 710/10 = 71 (în kilograme).

Ca și în acest exemplu particular, valoarea medie a unui set de date nu poate fi un punct de date al setului, ci va fi unic pentru un anumit set de date. Mean va avea aceleași unități ca și datele originale. Prin urmare, acesta poate fi marcat pe aceeași axă cu datele și poate fi utilizat în comparații. De asemenea, nu există nici o restricție de semn pentru media unui set de date. Poate fi negativ, zero sau pozitiv, deoarece suma setului de date poate fi negativă, zero sau pozitivă.

Care este deviația standard?

Abaterea standard este cel mai frecvent utilizat indice de dispersie. Pentru a calcula deviația standard, mai întâi se calculează deviațiile valorilor datelor din media. Media mediană a abaterilor rădăcină se numește deviația standard.

În exemplul precedent, abaterile respective față de medie sunt (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 și (79-71) = 8. Suma pătratelor de deviație este (-1) 2+ (-9) 2 + (-6) 2 + 1 2 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 > 2 = 366. Abaterea standard este √ (366/10) = 6 05 (în kilograme). Din aceasta, se poate concluziona că majoritatea datelor sunt în intervalul 71 ± 6.05, cu condiția ca setul de date să nu fie înclinat în mare măsură și acest lucru este adevărat în acest exemplu. Deoarece deviația standard are aceleași unități ca datele originale, aceasta ne dă o măsură a cât de mult a deviat datele de la centru; o deviație standard mai mare dispersia. De asemenea, abaterea standard va fi o valoare non-negativă, indiferent de natura datelor din setul de date. Care este diferența dintre deviația standard și media?

• Abaterea standard este o măsură de dispersie din centru, în timp ce media măsoară amplasarea centrului unui set de date.

• Abaterea standard este întotdeauna o valoare non-negativă, dar media poate lua orice valoare reală.