Regresie logistică vs. logistică
În analiza statistică, este important să se identifice relațiile dintre variabilele implicate în studiu. Uneori poate fi singurul scop al analizei în sine. Un instrument puternic folosit pentru a stabili existența relației și a identifica relația este analiza de regresie.
Cea mai simplă formă de analiză de regresie este regresia liniară, unde relația dintre variabile este o relație liniară. În termeni statistici, aceasta scoate în evidență relația dintre variabila explicativă și variabila de răspuns. De exemplu, folosind regresia, putem stabili relația dintre prețul materiilor prime și consum pe baza datelor colectate dintr-o probă aleatorie. Analiza de regresie va produce o funcție de regresie a setului de date, care este un model matematic care se potrivește cel mai bine datelor disponibile. Acest lucru poate fi ușor reprezentat de un complot împrăștiat. Grafica regresiei este echivalentă cu găsirea celei mai bune curbe de montare pentru setul de date dat. Funcția curbei este funcția de regresie. Folosind modelul matematic, utilizarea unui produs poate fi prevăzută pentru un anumit preț.
Prin urmare, analiza de regresie este utilizată pe scară largă în predicție și prognoză. De asemenea, se utilizează pentru a stabili relațiile în datele experimentale, în domeniile fizicii, chimiei și în multe științe naturale și în domeniul ingineriei. Dacă relația sau funcția de regresie este o funcție liniară, atunci procesul este cunoscut ca o regresie liniară. În complotul împrăștiat, acesta poate fi reprezentat ca o linie dreaptă. Dacă funcția nu este o combinație liniară a parametrilor, atunci regresia este neliniară.
Regresia logistică este comparabilă cu regresia multivariată și creează un model pentru a explica impactul predictorilor multipli asupra unei variabile de răspuns. Cu toate acestea, în regresia logistică, variabila rezultatului final ar trebui să fie categorică (de obicei împărțită, adică o pereche de rezultate atinse, cum ar fi moartea sau supraviețuirea, deși tehnicile speciale permit modelarea mai multor categorii de informații). O variabilă a rezultatului continuu poate fi transformată într-o variabilă categorică, care va fi utilizată pentru regresia logistică; totuși, prăbușirea variabilelor continue în acest mod este descurajată, deoarece reduce precizia.
Spre deosebire de regresia liniară, spre media, variabilele predictorului în regresia logistică nu trebuie să fie obligate să fie conectate liniar, distribuite în mod obișnuit sau să aibă variante egale în interiorul fiecărui cluster. Ca rezultat, relația dintre variabilele predictor și rezultatul nu este probabil să fie o funcție liniară.
Care este diferența dintre regresia logistică și cea liniară?
• În regresia liniară, se presupune o relație liniară între variabila explicativă și variabila de răspuns și parametrii care satisfac modelul se găsesc prin analiză, pentru a da relația exactă.
• Regresia liniară este efectuată pentru variabilele cantitative, iar funcția rezultată este cantitativă.
• În regresia logistică, datele folosite pot fi fie categorice, fie cantitative, dar rezultatul este întotdeauna categoric.