Corelația și regresia sunt cele două analize bazate pe distribuția multivariată. O distribuție multivariată este descrisă ca o distribuție a mai multor variabile. Corelație este descrisă ca analiză care ne permite să cunoaștem asocierea sau absența relației dintre două variabile "x" și "y". La celălalt capăt, regresiune analiză, prezice valoarea variabilei dependente bazată pe valoarea cunoscută a variabilei independente, presupunând că relația matematică medie între două sau mai multe variabile.
Diferența dintre corelație și regresie este una dintre întrebările frecvente în interviuri. În plus, mulți oameni suferă o ambiguitate în înțelegerea acestor două. Deci, să citiți complet acest articol pentru a avea o înțelegere clară asupra acestor două.
Bazele comparației | Corelație | regresiune |
---|---|---|
Sens | Corelația este o măsură statistică care determină co-relația sau asocierea a două variabile. | Regresia descrie modul în care o variabilă independentă este asociată numeric cu variabila dependentă. |
folosire | Pentru a reprezenta relația liniară între două variabile. | Pentru a potrivi o linie optimă și pentru a estima o variabilă pe baza unei alte variabile. |
Dependente și independente | Nicio diferenta | Ambele variabile sunt diferite. |
indică | Coeficientul de corelație indică măsura în care două variabile se mișcă împreună. | Regresia indică impactul unei modificări de unitate în variabila cunoscută (x) asupra variabilei estimate (y). |
Obiectiv | Pentru a găsi o valoare numerică care exprimă relația dintre variabile. | Pentru a estima valorile variabilei aleatoare pe baza valorilor variabilei fixe. |
Termenul de corelare este o combinație a două cuvinte "Co" (împreună) și relația (conexiunea) între două cantități. Corelația este atunci când, la momentul studierii a două variabile, se observă că o schimbare de unitate într-o variabilă este retaliată de o schimbare echivalentă într-o altă variabilă, adică directă sau indirectă. Sau, variabilele se spune că sunt necorelate atunci când mișcarea într-o variabilă nu echivalează cu nici o mișcare într-o altă variabilă într-o anumită direcție. Este o tehnică statistică care reprezintă forța conexiunii între perechi de variabile.
Corelația poate fi pozitivă sau negativă. Atunci când cele două variabile se mișcă în aceeași direcție, adică o creștere a unei variabile va avea ca rezultat o creștere corespunzătoare a unei alte variabile și invers, atunci variabilele sunt considerate a fi corelate pozitiv. De exemplu: profit și investiții.
Dimpotrivă, atunci când cele două variabile se mișcă în direcții diferite, astfel încât o creștere într-o variabilă va duce la o scădere a unei alte variabile și viceversa. Această situație este cunoscută drept corelație negativă. De exemplu: Prețul și cererea unui produs.
Măsurile de corelație sunt date sub forma:
O tehnică statistică pentru estimarea modificării variabilei dependente metrice datorată modificării uneia sau mai multor variabile independente, pe baza relației matematice medii între două sau mai multe variabile, este cunoscută sub denumirea de regresie. Acesta joacă un rol semnificativ în multe activități umane, deoarece este un instrument puternic și flexibil care a folosit pentru a prognoza evenimentele trecute, prezente sau viitoare pe baza evenimentelor trecute sau prezente. De exemplu: Pe baza înregistrărilor anterioare, profitul viitor al unei întreprinderi poate fi estimat.
Într-o regresie liniară simplă, există două variabile x și y, în care y depinde de x sau spune influențat de x. Aici y este numit dependență sau variabilă de criterii și x este variabilă independentă sau predictivă. Linia de regresie a y pe x este exprimată ca sub:
y = a + bx
unde, a = constantă,
b = coeficient de regresie,
În această ecuație, a și b sunt cei doi parametri de regresie.
Punctele de mai jos explică în detaliu diferența dintre corelație și regresie:
Cu discuția de mai sus, este evident că există o mare diferență între aceste două concepte matematice, deși aceste două sunt studiate împreună. Corelația este utilizată atunci când cercetătorul dorește să știe dacă variabilele studiate sunt corelate sau nu, dacă da, atunci care este forța asociației lor. Coeficientul de corelație Pearson este considerat drept cea mai bună măsură de corelare. În analiza de regresie, se stabilește o relație funcțională între două variabile, astfel încât să se facă proiecții viitoare privind evenimentele.