Diferența dintre media, mediană și mod

Mean vs. Median vs. Mod
 

Mediul, mediana și modul sunt primare măsuri de tendință centrală utilizat în statisticile descriptive. Ele sunt complet diferite una de cealaltă, iar cazurile în care sunt utilizate pentru a rezuma datele sunt de asemenea diferite.

Însemna

Media aritmetică este suma valorilor datelor împărțită la numărul de valori de date, adică.

 

Dacă datele provin dintr-un spațiu eșantion, se numește o medie a eșantionului (), care este o statistică descriptivă a eșantionului. Deși este cea mai frecvent folosită măsură descriptivă pentru un eșantion, nu este o statistică robustă. Este foarte sensibil la distorsiuni și oscilații.

De exemplu, ia în considerare venitul mediu al cetățenilor unui anumit oraș. Întrucât toate valorile datelor sunt însumate și apoi împărțite, venitul unei persoane extrem de bogate afectează în mod semnificativ media. Prin urmare, valorile medii nu reprezintă o reprezentare bună a datelor întotdeauna.

De asemenea, în cazul unui semnal alternativ, curentul care trece printr-un element variază periodic de la direcția pozitivă la direcția negativă și invers. Dacă luăm curentul mediu care trece prin element într-o singură perioadă, acesta va da 0, ceea ce înseamnă că nu a trecut nici un curent prin element, ceea ce, evident, nu este adevărat. Prin urmare, și în acest caz, media aritmetică nu este o măsură bună.

Media aritmetică este un indicator bun atunci când datele sunt distribuite uniform. Pentru o distribuție normală, media este egală cu modul și mediana. Ea are, de asemenea, cele mai mici reziduuri atunci când se ia în considerare eroarea medie rădăcină pătrată; prin urmare, cea mai bună măsură descriptivă atunci când este necesară reprezentarea unui set de date printr-un singur număr.

Median

Valorile punctului mediu de date după aranjarea tuturor valorilor datelor în ordine ascendentă sunt definite ca mediană a setului de date. Medianul este al doilea trimestru, al cincilea decil și al 50-lea percentil.

• Dacă numărul de observații (puncte de date) este ciudat, atunci mediana este observarea exactă în mijlocul listei ordonate.

• Dacă numărul de observații (punctele de date) este egal, atunci mediana este media celor două observații de mijloc din lista ordonată.

Medianul împarte observarea în două grupuri; adică un grup (50%) de valori mai mari și un grup (50%) de valori mai mici decât media. Medii sunt folosiți în mod specific în distribuții înclinate și reprezintă date destul de bune decât media aritmetică.

mod

Modul este cel mai mare număr dintr-un set de observații. Modul unui set de date se calculează prin găsirea frecvenței fiecărui element din set.

• Dacă nici o valoare nu apare mai mult de o dată, atunci setul de date nu are niciun mod.

• În caz contrar, orice valoare care apare cu cea mai mare frecvență este un mod al setului de date.

Mai mult de 1 mod poate exista într-un set; prin urmare, modulul nu este o statistică unică a unui set de date. Într-o distribuție uniformă, există un mod. Modul de distribuție a probabilității discrete este punctul în care funcția de masă a probabilității atinge punctul său cel mai înalt. Realizând interpretările de mai sus, putem spune asta maxime globale sunt moduri.

Luați în considerare aplicarea tuturor celor trei măsuri pentru următorul set de date.

DATE: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 9, 9, 9, 9, 9, 10, 10, , 15

Media = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8,12

Median = 9 (al 13-lea element)

Modul = 9 (frecvența de 9 = 5)

Care este diferența dintre Mediu, Median și Mod?

• Media aritmetică este suma valorilor (observațiilor) împărțită la numărul de observații. Nu este o statistică robustă și depinde în mare măsură de natura normală de distribuție în cadrul distribuției luate în considerare. O singură depășire poate provoca o schimbare semnificativă a valorii medii, dând valori relativ înșelătoare. Conceptul poate fi extins la media geometrică, media armonică, medie ponderată și așa mai departe.

• Mediana este valorile medii ale setului de observații și este relativ mai puțin afectată de valori extreme. Aceasta poate oferi o estimare bună ca statistică sumară în cazuri foarte înclinate.

• Modul este cea mai comună valoare de observare din setul de date. Dacă distribuția este înclinată pozitiv, modul se află la stânga până la mediană și, dacă este negativ înclinat, modul se află chiar la nivelul median.

• Dacă este înclinată pozitiv, media este corectă la mediană; dacă media negativă este în stânga mediană.

• În distribuția normală, toate cele trei, medie, mod și median sunt egale.