Diferența dintre varianța de eșantionare și varianța populației

Explicaţie

În statistici, termenul de eșantionare se referă la selectarea unei părți din datele statistice agregate în scopul obținerii de informații relevante despre întreg. Ansamblul sau întregul informație statistică privind un anumit caracter al tuturor membrilor care fac obiectul anchetei se numește "populație" sau "univers". (Das, N.G., 2010). Partea selectată a populației care este utilizată pentru a obține caracteristicile populației sau ale universului este denumită "eșantion". Populația este considerată a fi constituită din unități sau membri individuali, iar unele dintre unități sunt incluse în eșantion. Numărul total de unități ale populației se numește mărimea populației, iar cel al eșantionului se numește mărimea eșantionului. Populația și eșantionul pot fi finite sau infinite și în mod similar acestea pot fi existe sau ipotetice.

Varianță: Variația este o valoare numerică care arată cât de mult se diferențiază cifrele individuale într-un set de date cu privire la media. Acesta este modul în care fiecare număr este de la mijloc și astfel unul de celălalt. O variație a valorii zero înseamnă că toate datele sunt identice. Mai mult varianța, mai multe sunt valorile răspândite în jurul valorii de medie, deci unul de celălalt. Mai puțin varianța, mai puține sunt valorile răspândite despre medie, de aici unul de celălalt și varianța nu poate fi negativă.

Diferența dintre varianța populației și variația eșantionului

Principala diferență între varianța populației și variația eșantionului se referă la calcularea varianței. Varianța este calculată în cinci etape. Se calculează primul mediu, apoi se calculează abaterile de la medie și, în al treilea rând, abaterile sunt pătrat, în al patrulea rând abaterile pătrat sunt însumate și în final această sumă este împărțită la numărul de elemente pentru care se calculează varianța. Astfel varianța = Σ (xi-x -) / n. Unde xi = i. Numărul, x- = media și n = numărul de articole ...

Acum, când varianța trebuie calculată din datele populației, n este egală cu numărul de elemente. Astfel, dacă variația tensiunii arteriale a tuturor celor 1000 de oameni trebuie calculată pe baza datelor privind presiunea sângelui a tuturor celor 1000 de oameni, atunci n = 1000. Cu toate acestea, atunci când varianța este calculată din datele probei 1 trebuie dedusă din n înainte de împărțirea suma abaterilor pătrat. Astfel, în exemplul de mai sus, dacă datele eșantionului au 100 de elemente, numitorul ar fi 100 - 1 = 99.

Din acest motiv, valoarea varianței calculate din datele eșantionului este mai mare decât valoarea care ar fi putut fi obținută prin utilizarea datelor populației. Logica de a face acest lucru este de a compensa lipsa noastră de informații cu privire la datele privind populația. Este imposibil să aflăm variante de înălțimi în ființele umane, pentru lipsa noastră absolută de informații despre înălțimile tuturor ființelor umane vii, nu pentru a vorbi despre viitor. Chiar dacă luăm un exemplu moderat, cum ar fi datele populației privind înălțimile tuturor oamenilor vii din SUA, este posibil din punct de vedere fizic, dar costul și timpul implicat în acest lucru ar învinge scopul calculului său. Acesta este motivul pentru care datele esantionale sunt luate pentru majoritatea scopurilor statistice, iar acest lucru este insotit de lipsa de informatii despre majoritatea datelor. Pentru a compensa acest lucru, valoarea varianței și deviației standard, care este rădăcina pătrată a varianței, este mai mare în cazul datelor de eșantion decât varianța de la datele populației.

Aceasta acționează ca un scut automat pentru analiști și factorii de decizie. Logica se aplică deciziilor privind bugetarea de capital, finanțarea personală și de afaceri, construcția, gestionarea traficului și multe domenii aplicabile. Acest lucru ajută participantul să fie în siguranță în timp ce ia decizii sau pentru alte concluzii.

Rezumat: Variația populației se referă la valoarea varianței care se calculează din datele populației, iar variația eșantionului este varianța calculată din datele eșantionului. Datorită acestei valori a numitorului în formula de variație în cazul datelor de eșantion este 'n-1' și este 'n' pentru datele populației. Drept rezultat, atât varianța, cât și deviația standard derivată din datele eșantionului sunt mai mult decât cele constatate din datele populației.