Deviația standard vs. Media
În statisticile descriptive și inferențiale, mai mulți indicatori sunt utilizați pentru a descrie un set de date corespunzător tendinței sale centrale, dispersiei și șiretuirii. În inferența statistică, acestea sunt cunoscute în general ca estimatori, deoarece estimează valorile parametrilor populației.
Tendința centrală se referă la și localizează centrul distribuției valorilor. Media, modul și mediana sunt indicii cei mai frecvent utilizați în descrierea tendinței centrale a unui set de date. Dispersia este cantitatea de răspândire a datelor din centrul distribuției. Intervalul și abaterea standard sunt cele mai frecvent utilizate măsuri de dispersie. Coeficienții de zgomot al lui Pearson sunt utilizați pentru a descrie decalajul unei distribuții de date. Aici, skewness se referă la faptul dacă setul de date este simetric cu privire la centru sau nu și, dacă nu, cât de înclinat este.
Ce inseamna?
Media reprezintă indicele cel mai frecvent utilizat al tendinței centrale. Dat fiind un set de date, media se calculează luându-se suma tuturor valorilor datelor și apoi împărțind-o cu numărul de date. De exemplu, greutatea a 10 persoane (în kilograme) este măsurată la 70, 62, 65, 72, 80, 70, 63, 72, 77 și 79. Apoi, greutatea medie a celor zece persoane (în kilograme) calculată după cum urmează. Suma greutăților este 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Media = (sumă) / (număr de date) = 710 /.
Ca și în acest exemplu particular, valoarea medie a unui set de date poate să nu fie un punct de date al setului, dar va fi unic pentru un anumit set de date. Mean va avea aceleași unități ca și datele originale. Prin urmare, acesta poate fi marcat pe aceeași axă cu datele și poate fi utilizat în comparații. De asemenea, nu există nici o restricție de semn pentru media unui set de date. Poate fi negativ, zero sau pozitiv, deoarece suma setului de date poate fi negativă, zero sau pozitivă.
Care este abaterea standard??
Deviația standard este indicele cel mai frecvent utilizat de dispersie. Pentru a calcula deviația standard, mai întâi se calculează deviațiile valorilor datelor din media. Media mediană a abaterilor rădăcină se numește deviația standard.
În exemplul precedent, abaterile respective față de medie sunt (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 și (79-71) = 8. Suma pătratele abaterii sunt (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. Abaterea standard este √ (366/10) = 6,05 (în kilograme). Din aceasta, se poate concluziona că majoritatea datelor sunt în intervalul 71 ± 6,05, cu condiția ca setul de date să nu fie înclinat în mare măsură și acest lucru este adevărat în acest exemplu particular.
Deoarece deviația standard are aceleași unități ca datele originale, aceasta ne dă o măsură a cât de mult a deviat datele de la centru; o deviație standard mai mare dispersia. De asemenea, abaterea standard va fi o valoare non-negativă, indiferent de natura datelor din setul de date.
Care este diferența dintre deviația standard și media? • Abaterea standard este o măsură de dispersie din centru, în timp ce media măsoară amplasarea centrului unui set de date. • Deviația standard este întotdeauna o valoare non-negativă, dar media poate lua orice valoare reală.
|