Diferența dintre deviația standard și eroarea standard

Introducere

Standard Devitare (SD) și Standard ERRoR (SE) sunt terminologii similare; cu toate acestea, ele sunt conceptual atât de variate încât sunt folosite aproape interschimbabil în literatura de specialitate. Ambii termeni sunt de obicei precedați de un simbol plus-minus (+/-) care indică faptul că ele definesc o valoare simetrică sau reprezintă un interval de valori. Invariabil, ambii termeni apar cu o medie (medie) dintr-un set de valori măsurate.

Interesant este faptul că o SE nu are nimic de-a face cu standardele, cu erori sau cu comunicarea datelor științifice.

O privire detaliată asupra originii și explicării SD și SE va dezvălui, de ce statisticienii profesioniști și cei care o utilizează cursor, ambele tind să greșească.

Deviația standard (SD)

Un SD este a descriptiv care descrie distribuția unei distribuții. Ca metric, este util atunci când datele sunt distribuite în mod normal. Cu toate acestea, este mai puțin util atunci când datele sunt foarte înclinate sau bimodale, deoarece nu descriu foarte bine forma distribuției. În mod obișnuit, folosim SD atunci când raportăm caracteristicile eșantionului, deoarece intenționăm să descrie cât de multe date variază în jurul valorii de medie. Alte statistici utile pentru descrierea răspândirii datelor sunt intervalul intercalcantil, percentilele 25 și 75 și intervalul de date.

Figura 1. SD este o măsură a răspândirii datelor. Atunci când datele sunt o probă dintr-o distribuție distribuită în mod normal, atunci se așteaptă ca două treimi din date să se situeze în cadrul unei deviații standard a mediei.

Varianța este a descriptiv statistic, de asemenea, și este definită drept pătratul deviației standard. Acesta nu este raportat, de obicei, la descrierea rezultatelor, ci este o formulă mai trasabilă din punct de vedere matematic (și anume suma abaterilor pătrat) și joacă un rol în calcularea statisticilor.

De exemplu, dacă avem două statistici P & Q cu variante cunoscute var(P) & var(Q), apoi variația sumei P + Q este egal cu suma variațiilor: var(P) +var(Q). Acum este evident de ce statisticienii vor să vorbească despre variante.

Dar deviațiile standard au un înțeles important pentru răspândire, mai ales atunci când datele sunt distribuite în mod normal: Intervalul mediu +/ - 1 SD poate fi de așteptat să captureze 2/3 din eșantion, iar media intervalului +- 2 SD poate fi de așteptat să captureze 95% din eșantion.

SD oferă o indicație în ce măsură răspunsurile individuale la o întrebare variază sau se abate de la mijloc. SD îi spune cercetătorului modul în care sunt răspândite răspunsurile - sunt concentrate în jurul valorii de mijloc, sau împrăștiate departe și larg? Toate respondenții v-au evaluat produsul în mijlocul scalei dvs. sau unii l-au aprobat și unii l-au dezaprobat?

Luați în considerare un experiment în care respondenții sunt rugați să evalueze un produs pe o serie de atribute pe o scară de 5 puncte. Media pentru un grup de zece respondenți (denumită "A" până la "J" de mai jos) pentru "valoare bună pentru bani" a fost de 3,2 cu un SD de 0,4, iar media pentru "fiabilitatea produsului" a fost de 3,4.

La prima vedere (privindu-se doar la mijloace) se pare că fiabilitatea a fost evaluată mai mult decât valoarea. Cu toate acestea, SD mai mare pentru fiabilitate ar putea indica (așa cum se arată în distribuția de mai jos) că răspunsurile au fost foarte polarizate, unde majoritatea respondenților nu au avut probleme de fiabilitate (evaluat atributul "5"). o problemă de fiabilitate și a evaluat atributul "1". Privind singura înseamnă doar o parte din poveste, totuși, de cele mai multe ori, acest lucru se concentrează pe cercetători. Distribuția răspunsurilor este importantă și SD oferă o măsură descriptivă valoroasă în acest sens.

care răspunde Valoare bună pentru bani Fiabilitatea produselor
A 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
eu 3 5
J 3 5
Însemna 3.2 3.4
Std. dev. 0.4 2.1

Primul studiu: Respondenții clasifică un produs pe o scară de 5 puncte

Două distribuții foarte diferite ale răspunsurilor la o scală de rating de 5 puncte pot avea aceeași valoare. Luați în considerare următorul exemplu care prezintă valorile răspunsului pentru două evaluări diferite.

În primul exemplu (Evaluare "A"), SD este zero, deoarece TOATE răspunsurile au fost exact valoarea medie. Răspunsurile individuale nu s-au abătut de la mijloc.

În clasificarea "B", chiar dacă media grupului este aceeași (3,0) ca prima distribuție, deviația standard este mai mare. Deviația standard de 1,15 arată că răspunsurile individuale, în medie, * au fost puțin peste 1 punct de la media.

care răspunde Evaluare "A" Rating "B"
A 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
eu 3 4
J 3 5
Însemna 3.0 3.0
Std. dev. 0.00 1.15

Al doilea studiu: Respondenții clasifică un produs la o scară de 5 puncte

O altă modalitate de a privi SD este reprezentarea grafică a distribuției ca o histogramă a răspunsurilor. O distribuție cu un nivel scăzut al SD ar avea o formă îngustă, în timp ce un SD mare ar fi indicat printr-o formă mai largă.

SD, în general, nu indică "bine sau rău" sau "mai bine sau mai rău" - un SD inferior nu este neapărat mai de dorit. Este folosit doar ca o statistică descriptivă. Descrie distribuția în raport cu media.

Tdisclaimer tehnic privind SD

Gândirea SD ca "deviație medie" este o modalitate excelentă de a înțelege înțelesul înțeles. Cu toate acestea, aceasta nu este calculată ca o medie (dacă ar fi, am numi-o "deviația medie"). În schimb, este "standardizat", o metodă oarecum complexă de calculare a valorii folosind suma pătratelor.

În scopuri practice, calculul nu este important. Cele mai multe programe de tabulare, foi de calcul sau alte instrumente de gestionare a datelor vor calcula SD-ul pentru dvs. Mai important este să înțelegem ce spun statisticile.

Eroare standard

O eroare standard este o eroare bazat pe deducție statistică care se utilizează la compararea mediei de eșantionare (medii) în rândul populațiilor. Este o măsură de precizie din media eșantionului. Media eșantionului este o statistică derivată din datele care au o distribuție de bază. Nu putem să o vizualizăm în același mod ca datele, deoarece am realizat un singur experiment și avem doar o singură valoare. Teoria statistică ne spune că media eșantionului (pentru o probă mare "suficientă" și în câteva condiții de regularitate) este distribuită aproximativ în mod normal. Deviația standard a acestei distribuții normale este ceea ce numim eroarea standard.

Figura 2. Distribuția în partea inferioarătransmite distribuția datelor, în timp ce distribuția în partea superioară este distribuția teoretică a mediei eșantionului. SD a 20 este o măsură a răspândirii datelor, în timp ce SE din 5 este o măsură a incertitudinii în jurul valorii mediei eșantionului.

Când vrem să comparăm mijloacele de rezultate dintr-un experiment cu două eșantioane de tratament A vs. tratament B, atunci trebuie să estimăm cât de precis am măsurat mijloacele.

De fapt, suntem interesați de cât de precis am măsurat diferența dintre cele două mijloace. Numim această măsură eroarea standard a diferenței. Este posibil să nu fiți surprins să aflați că eroarea standard a diferenței dintre eșantionul reprezintă o funcție a erorilor standard ale mijloacelor:

Acum că ați înțeles că eroarea standard a mediei (SE) și deviația standard a distribuției (SD) sunt două animale diferite, poate vă întrebați cum au fost confundate în primul rând. În timp ce diferă conceptual, au o relație simplă matematic:

,unde n este numărul de puncte de date.

Observați că eroarea standard depinde de două componente: abaterea standard a probei și dimensiunea eșantionului n. Acest lucru are sens intuitiv: cu cât deviația standard a eșantionului este mai mare, cu atât putem fi mai puțin exacte cu privire la estimarea noastră reală a mediei.

De asemenea, dimensiunea mare a eșantionului, cu cât avem mai multe informații despre populație și cu atât mai exact putem să estimăm adevărata medie.

SE este o indicație a fiabilității mediei. Un SE mic este un indiciu că media eșantionului este o reflectare mai exactă a mediei efective a populației. O mărime mai mare a eșantionului va duce în mod normal la un SE mai mic (în timp ce SD nu este direct afectat de dimensiunea eșantionului).

Cele mai multe studii de cercetare implică desenarea unei mostre de la o populație. Apoi, vom deduce rezultatele referitoare la populație din rezultatele obținute din acel eșantion. Dacă a fost extras un al doilea eșantion, probabil că rezultatele nu se vor potrivi exact cu primul eșantion. Dacă valoarea medie pentru un atribut de rating era de 3,2 pentru o probă, ar putea fi 3,4 pentru un al doilea eșantion de aceeași mărime. Dacă ar fi desenat un număr infinit de eșantioane (de dimensiuni egale) din populația noastră, am putea arăta mijloacele observate ca o distribuție. Apoi am putea calcula o medie a tuturor probelor noastre. Această medie ar fi egală cu media reală a populației. Putem de asemenea calcula SD a distribuției mijloacelor de eșantionare. SD a acestei distribuții a mijloacelor de eșantionare este SE a fiecărei medii de eșantionare individuale.

Prin urmare, avem cea mai importantă observație: SE este SD a mediei populației.

Probă Însemna
1 3.2
a 2- 3.4
a 3- 3.3
4a 3.2
a 5- 3.1
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Însemna 3.3
Std. dev. 0,13

Tabel care ilustrează relația dintre SD și SE

Acum este clar că, dacă SD a acestei distribuții ne ajută să înțelegem cât de mult înseamnă o mostră din populația adevărată, atunci putem folosi aceasta pentru a înțelege cât de precisă este orice eșantion individual în raport cu media reală. Aceasta este esența SE.

În realitate, am atras doar o singură probă din populația noastră, dar putem folosi acest rezultat pentru a furniza o estimare a fiabilității mijlocului nostru de eșantionare observat.

De fapt, SE ne spune că putem fi încrezători în 95% că media eșantionului observat este de plus sau minus aproximativ 2 (de fapt 1,96) Erori standard din media populației.

Tabelul de mai jos prezintă distribuția răspunsurilor primului (și numai) mostră utilizat pentru cercetarea noastră. SE de 0,13, fiind relativ mic, ne dă o indicație că media noastră este relativ apropiată de media reală a populației noastre globale. Marja de eroare (la încredere de 95%) pentru media noastră este (aproximativ) de două ori valoarea (+/- 0,26), spunându-ne că media reală este cel mai probabil între 2,94 și 3,46.

care răspunde evaluare
A 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
eu 3
J 3
Însemna 3.2
Std. păcătui 0,13

rezumat

Mulți cercetători nu reușesc să înțeleagă distincția dintre Deviația standard și eroarea standard, chiar dacă acestea sunt incluse în analiza datelor. Deși calculele efective pentru Deviația Standard și Eroarea Standard arată foarte asemănătoare, ele reprezintă două măsuri foarte diferite, dar complementare. SD ne spune despre forma distribuției noastre, cât de apropiate sunt valorile individuale ale datelor de la valoarea medie. SE ne spune cât de apropiat este eșantionul nostru față de media reală a populației globale. Împreună, ele ajută la a oferi o imagine mai completă decât ceea ce ne poate spune singur.