Varianță vs Covariance
Varianța și covarianța sunt două măsuri utilizate în statistici. Varianța este o măsură a împrăștierii datelor, iar covarianța indică gradul de schimbare a două variabile aleatorii împreună. Varianța este mai degrabă un concept intuitiv, dar covarianța este definită matematic, nu în primul rând intuitivă.
Mai multe despre varianță
Varianța este o măsură de dispersie a datelor de la valoarea medie a distribuției. Ea arată cât de departe punctele de date se află din mijlocul distribuției. Este unul din descriptorii principali ai distribuției probabilităților și unul dintre momentele distribuției. De asemenea, varianța este un parametru al populației, iar variația unui eșantion din populație acționează ca un estimator al varianței populației. Dintr-o perspectivă, aceasta este definită drept pătratul deviației standard.
În limbaj simplu, poate fi descris ca media pătratelor distanței dintre fiecare punct de date și media distribuției. Formula următoare este utilizată pentru calcularea varianței.
Var (X) = E [(X-μ)2 ] pentru o populație și
Var (X) = E [(X-~x)2 ] pentru un eșantion
Acesta poate fi simplificat pentru a da Var (X) = E [X2 ] - (E [X])2.
Varianța are câteva proprietăți de semnătură și este adesea folosită în statistici pentru a simplifica utilizarea. Varianța nu este negativă, deoarece este pătratul distanțelor. Cu toate acestea, intervalul variației nu este limitat și depinde de distribuția specială. Variația unei variabile aleatorii constante este zero, iar varianța nu se modifică în raport cu un parametru de localizare.
Mai multe despre Covariance
În teoria statistică, covarianța este o măsură a cât de multe variabile aleatoare se schimbă împreună. Cu alte cuvinte, covarianța este o măsură a puterii corelației dintre două variabile aleatorii. De asemenea, poate fi considerată o generalizare a conceptului de varianță a două variabile aleatoare.
Covarianța a două variabile aleatoare X și Y, care sunt distribuite în comun cu impuls finit secundar, este cunoscută sub denumirea σX Y= E [(X-E [X]) (Y-E [Y])]. Din aceasta, varianța poate fi văzută ca un caz special de covarianță, unde două variabile sunt aceleași. Cov (X, X) = Var (X)
Prin normalizarea covarianței se poate obține coeficientul de corelare liniară sau coeficientul de corelație Pearson, care este definit ca ρ = E [(X-E [X]) (Y-E [Y]X σY ) = (Cov (X, Y)) / (σX σY)
Din punct de vedere grafic, covarianța dintre o pereche de puncte de date poate fi văzută ca suprafața dreptunghiului cu punctele de date de la vârfurile opuse. Aceasta poate fi interpretată ca o măsură de amploare a separării dintre cele două puncte de date. Luând în considerare dreptunghiurile pentru întreaga populație, suprapunerea dreptunghiurilor corespunzătoare tuturor punctelor de date poate fi considerată ca fiind forța separării; varianța celor două variabile. Covariance are două dimensiuni, datorită a două variabile, însă simplificarea acesteia la o variabilă dă varianța unui singur ca separarea într-o singură dimensiune.
Care este diferența dintre Varianță și Covariance?
• Variația este măsura de răspândire / dispersie într-o populație, în timp ce covarianța este considerată ca o măsură de variație a două variabile aleatorii sau puterea corelației.
• Varianța poate fi considerată ca un caz special de covarianță.
• Variația și covarianța depind de magnitudinea valorilor datelor și nu pot fi comparate; prin urmare, acestea sunt normalizate. Covariance este normalizată în coeficientul de corelație (împărțind produsul deviațiilor standard ale celor două variabile aleatorii) și varianța este normalizată în abaterea standard (prin luarea rădăcinii pătrate)