Diferența dintre T-TEST și ANOVA

T-TEST vs. ANOVA

Colectarea și calcularea datelor statistice pentru a obține media este adesea un proces lung și obositor. Testul t și analiza unică a varianței (ANOVA) sunt cele două teste cele mai comune utilizate în acest scop.

Testul t este un test de ipoteză statistică în care statistica de testare urmează distribuției Studentului t dacă ipoteza nulă este susținută. Această încercare se aplică atunci când statistica de testare urmează o distribuție normală, iar valoarea unui termen de scalare în statisticile de testare este cunoscută. Dacă termenul de scalare este necunoscut, acesta este apoi înlocuit cu o estimare bazată pe datele disponibile. Statisticile de testare vor urma o distribuție a studenților.

William Sealy Gosset a introdus t-statistica în 1908. Gosset a fost un chimist pentru fabrica de bere Guinness din Dublin, Irlanda. Fabrica de bere Guinness a avut politica de a recruta cei mai buni absolvenți din Oxford și Cambridge, selectând de la cei care ar putea oferi aplicații de biochimie și statistici proceselor industriale stabilite de companie. William Sealy Gosset a fost unul absolvent. În acest proces, William Sealy Gosset a conceput testul t, care a fost inițial conceput ca o modalitate de a monitoriza calitatea bobului (berea întunecată a fabricii de bere) într-un mod rentabil. Gosset a publicat testul sub numele de student "Student" în Biometrika, circa 1908. Motivul pentru numele pen-ului a fost insistența Guinness, deoarece compania dorea să-și păstreze politica de utilizare a statisticilor ca parte a "secretelor lor comerciale".

Statisticile T-testului urmează în general formularul T = Z / s, unde Z și s sunt funcții ale datelor. Variabila Z este concepută pentru a fi sensibilă la ipoteza alternativă; în mod eficient, magnitudinea variabilei Z este mai mare atunci când ipoteza alternativă este adevărată. Între timp, 's' este un parametru de scalare, permițând distribuția T să fie determinată. Ipotezele care stau la baza unui test t sunt că a) Z urmează o distribuție normală standard sub ipoteza nulă; b) ps2 urmează o distribuție Ï ‡ 2 cu p grade de libertate sub ipoteza nulă (unde p este o constantă pozitivă); și c) valoarea Z și valoarea s sunt independente. Într-un anumit tip de t-test, aceste condiții sunt consecințe ale populației studiate, precum și modul în care datele sunt eșantionate.

Pe de altă parte, analiza varianței (ANOVA) este o colecție de modele statistice. În timp ce principiile ANOVA au fost folosite de cercetători și statisticieni de multă vreme, nu a fost decât în ​​1918, că Sir Ronald Fisher a făcut o propunere de a formaliza analiza varianței într-un articol intitulat "Corelația între rude asupra supoziției de moștenire mendeliană" . De atunci, ANOVA a fost extinsă în domeniul de aplicare și aplicare. ANOVA este de fapt un defectuos, deoarece nu este derivat din diferențele de variații, ci mai degrabă de diferențele dintre mijloacele grupurilor. Aceasta include procedurile asociate în care varianța observată într-o anumită variabilă este împărțită în componente care pot fi atribuite diferitelor surse de variație.

În esență, un ANOVA oferă un test statistic pentru a determina dacă mijloacele mai multor grupuri sunt egale și, ca rezultat, generalizează testul t la mai mult de două grupe. Un ANOVA poate fi mai util decât un t-test cu două eșantioane, deoarece are o șansă mai mică de a comite o eroare de tip I. De exemplu, având mai multe teste de t-două probe ar avea o șansă mai mare de a comite o eroare decât o ANOVA a acelorași variabile implicate pentru a obține media. Modelul este același și statistica de testare este raportul F. În termeni mai simpli, testele t sunt doar un caz special al ANOVA: realizarea unui ANOVA va avea același rezultat al testelor multiple t. Există trei clase de modele ANOVA: a) modele cu efecte fixe care presupun că datele provin de la populații normale, care diferă numai prin mijloacele lor; b) modelele de efecte aleatoare care asumă datele descriu o ierarhie a populațiilor variabile ale căror diferențe sunt constrânse de ierarhie; și c) modele cu efect mixt, care sunt situații în care există atât efecte fixe, cât și aleatoare.

Rezumat:

  1.  Testul t este utilizat pentru a determina dacă două medii sau mijloace sunt aceleași sau diferite. ANOVA este preferată atunci când se compară trei sau mai multe medii sau mijloace.
  2.  Un test t are mai multe șanse de a comite o eroare cu cât sunt folosite mai multe mijloace, motiv pentru care ANOVA este utilizat atunci când se compară două sau mai multe mijloace.