Corelație vs. Covariance
Corelația și covarianța sunt concepte strâns legate în statisticile teoretice. Ele sunt importante în determinarea relației dintre două variabile aleatorii.
Ce este corelația?
Corelația este o măsură a puterii relației dintre două variabile. Coeficientul de corelare cuantifică gradul de modificare a unei variabile bazat pe schimbarea celeilalte variabile. În statistici, corelația este legată de conceptul de dependență, care este relația statistică dintre două variabile
Coeficientul de corelație Pearson sau doar coeficientul de corelație r este o valoare între -1 și 1 (-1≤r≤ + 1). Acesta este cel mai frecvent utilizat coeficient de corelație și valabil numai pentru o relație liniară între variabile. Dacă r = 0 nu există nici o relație și dacă r≥0 relația este direct proporțională; valoarea unei variabile crește odată cu creșterea celeilalte. Dacă r≤0 relația este invers proporțională; o scădere variabilă, pe măsură ce cealaltă crește.
Din cauza condiției de liniaritate, coeficientul de corelație r poate fi, de asemenea, utilizat pentru a stabili prezența unei relații liniare între variabile.
Ce este Covariance?
În teoria statistică, covarianța este o măsură a cât de multe variabile aleatoare se schimbă împreună. Cu alte cuvinte, covarianța este o măsură a puterii corelației dintre două variabile aleatorii.
Într-o altă perspectivă, se poate observa că corelația este doar versiunea normalizată a covarianței, unde covarianța este împărțită de produsul deviațiilor standard ale celor două variabile aleatorii. Intervalul de covarianță poate fi mare; prin urmare, nu este ușor de comparat. Această dificultate este depășită prin aducerea valorilor covarianței într-o gamă în care poate fi comparată prin normalizarea acesteia (un fel de fel de ceea ce face scorul z). Deși covarianța și varianța sunt legate una de cealaltă în maniera de mai sus, distribuțiile lor de probabilitate nu sunt atașate una de alta în mod simplu și trebuie tratate separat.
Care este diferența dintre Corelație și Covariance?
• Atât corelația cât și covarianța sunt măsurători ale relației dintre două variabile aleatorii. Corelația este măsura puterii liniarității celor două variabile și covarianța este o măsură a puterii corelației.
• Valorile coeficientului de corelare sunt o valoare între -1 și +1, în timp ce intervalul de covarianță nu este constant, dar poate fi pozitiv sau negativ. Dar dacă variabilele aleatoare sunt standardizate înainte de a calcula covarianța, atunci covarianța este egală cu corelația și are o valoare între -1 și +1.