Însemna (sau medie) și median sunt termeni statistici care au un rol oarecum similar în ceea ce privește înțelegerea tendința centrală a unui set de scoruri statistice. Deși media a fost, în mod tradițional, o măsură populară a unui punct intermediar într-un eșantion, aceasta are dezavantajul că ar fi afectată de o singură valoare prea mare sau prea mică în comparație cu restul eșantionului. Acesta este motivul pentru care o mediană este uneori luată ca o măsură mai bună a unui punct intermediar.
Însemna | Median | |
---|---|---|
Definiție | Media reprezintă media aritmetică a unui set de numere sau distribuție. | Mediana este descrisă ca valoarea numerică care separă jumătatea superioară a unui eșantion, a unei populații sau a unei distribuții de probabilitate din jumătatea inferioară. |
aplicabilitate | Media este folosită pentru distribuțiile normale. | Mediana este folosită în general pentru distribuții înclinate. |
Relevanța la setul de date | Media nu este un instrument robust deoarece este în mare măsură influențată de valori extreme. | Mediana este mai potrivită pentru distribuțiile înclinate pentru a deriva de la tendința centrală, deoarece este mult mai robustă și mai sensibilă. |
Cum se calculează | Se calculează o medie prin adăugarea tuturor valorilor și împărțirea scorului cu numărul de valori. | Medianul este numărul găsit la mijlocul exact al setului de valori. O mediană poate fi calculată prin listarea tuturor numerelor în ordine ascendentă și apoi localizarea numărului în centrul acelei distribuții. |
În matematică și statistică, media sau media aritmetică a unei liste de numere este suma întregii liste împărțită la numărul de elemente din listă. Când privim distribuțiile simetrice, media este probabil cea mai bună măsură pentru a ajunge la tendința centrală. În teoria și statisticile de probabilitate, a median este acel număr care separă jumătatea superioară a unui eșantion, o populație sau o distribuție de probabilitate de la jumătatea inferioară.
Însemna sau medie este probabil cea mai frecvent utilizată metodă de descriere a tendinței centrale. Se calculează o medie prin adăugarea tuturor valorilor și împărțirea scorului cu numărul de valori. media aritmetică a unui eșantion este suma valorilor eșantionate împărțite la numărul de elemente din eșantion:
Median este numărul găsit la mijlocul exact al setului de valori. O mediană poate fi calculată prin listarea tuturor numerelor în ordine ascendentă și apoi localizarea numărului în centrul acelei distribuții. Aceasta se aplică unei liste de numere impare; în cazul unui număr egal de observații, nu există nici o valoare mijlocie unică, deci este o practică obișnuită de a lua media celor două valori medii.
Să spunem că sunt nouă studenți într-o clasă cu următoarele scoruri: 2, 4, 5, 7, 8, 10, 12, 13, 83. În acest caz, scorul mediu (sau însemna) este suma tuturor scorurilor împărțite la nouă. Aceasta funcționează până la 144/9 = 16. Rețineți că, deși 16 este media aritmetică, aceasta este distorsionată de un scor neobișnuit de mare de 83 în comparație cu alte scoruri. Aproape toate scorurile elevilor sunt de mai jos media. Prin urmare, în acest caz, media nu este un bun reprezentant al tendința centrală din această probă.
median, pe de altă parte, este valoarea care este de așa natură încât jumătate dintre scoruri sunt deasupra ei și jumătate din scorurile de mai jos. Astfel, în acest exemplu, media este 8. Există patru scoruri de mai jos și patru deasupra valorii 8. Astfel, 8 reprezintă punctul de mijloc sau tendința centrală a eșantionului.
Comparația mediei, a mediei și a modului de distribuție a două distribuții log-normale cu o diferență diferită.Mean nu este un instrument statistic robust, deoarece nu poate fi aplicat la toate distribuțiile, dar este cu ușurință instrumentul statistic cel mai utilizat pentru a determina tendința centrală. Motivul pentru care mediul nu poate fi aplicat tuturor distribuțiilor este pentru că devine afectat în mod nejustificat de valorile din eșantion care sunt prea mici pentru a fi prea mari.
Dezavantajul median este că este dificil de manevrat teoretic. Nu există o formulă matematică ușoară pentru a calcula mediana.
Există multe modalități de a determina tendința centrală sau medie a unui set de valori. Media discutată mai sus este din punct de vedere tehnic media aritmetică și este statistica cea mai frecvent utilizată pentru medie. Există și alte tipuri de mijloace:
Mediul geometric este definit ca nrădăcină de produs de n numere, adică pentru un set de numere X1,X2,... ,Xn, media geometrică este definită ca
Mijloacele geometrice sunt mai bune decât mijloacele aritmetice pentru descrierea creșterii proporționale. De exemplu, o aplicație bună pentru media geometrică este calculul ratei anuale de creștere compuse (CAGR).
Media armonică este reciprocă a mediei aritmetice a reciprocelor. Media armonică H din numerele reale pozitive X1,X2,... ,Xn este
O aplicație bună pentru mijloacele armonice este atunci când multiplii medii. De exemplu, este mai bine să se folosească media armonică ponderată la calcularea raportului mediu preț-câștig (P / E). Dacă rapoartele P / E sunt medii utilizând o medie aritmetică ponderată, punctele mari de date obțin greutăți mult mai mari decât punctele de date mici.
Media aritmetică, media geometrică și armonică reprezintă împreună un set de mijloace numite mijloace pitagoreene. Pentru orice set de numere, media armonică este întotdeauna cea mai mică din toate mijloacele pitagoreene, iar media aritmetică este întotdeauna cea mai mare dintre cele 3 mijloace. adică media armonică ≤ media geometrică ≤ media aritmetică.
Însemna poate fi folosit ca o figură de vorbire și deține o referință literară. Este, de asemenea, folosit pentru a implica săraci sau a nu fi mare. Median, într-o referință geometrică, este o linie dreaptă care trece de la un punct al triunghiului la centrul părții opuse.