diferența cheie între clasificarea și arborele de regresie este asta în clasificare, variabilele dependente sunt categorice și neordonate în timp ce în regresie variabilele dependente sunt valori întregi continue sau ordonate.
Clasificarea și regresia sunt tehnici de învățare pentru a crea modele de predicție din datele colectate. Ambele tehnici sunt reprezentate grafic ca arbori de clasificare și de regresie sau, mai degrabă, diagrame cu diviziuni de date după fiecare pas sau, mai degrabă, "ramură" în arbore. Acest proces se numește partiționare recursivă. Domeniile cum ar fi Mining utilizează aceste tehnici de clasificare și de învățare prin regresie. Acest articol se concentrează pe arborele de clasificare și arborele de regresie.
1. Prezentare generală și diferență cheie
2. Ce este Clasificarea
3. Ce este Regresia
4. Comparație comparativă comparativă - clasificare vs regresie în formă tabulară
5. rezumat
Clasificarea este o tehnică folosită pentru a ajunge la o schemă care arată organizarea datelor începând cu o variabilă precursor. Variabilele dependente sunt ceea ce clasifică datele.
Figura 01: Explorarea datelor
Arborele de clasificare începe cu variabila independentă, care se prefigurează în două grupe determinate de variabilele dependente existente. Se intenționează elucidarea răspunsurilor sub forma clasificării aduse de variabilele dependente.
Regresia este o metodă de predicție care se bazează pe o valoare de ieșire numerică presupusă sau cunoscută. Această valoare de ieșire este rezultatul unei serii de partiții recursive, fiecare pas având o valoare numerică și un alt grup de variabile dependente care se extind spre o altă pereche, cum ar fi aceasta.
Arborele de regresie începe cu una sau mai multe variabile precursor și se termină cu o variabilă finală de ieșire. Variabilele dependente sunt variabile numerice continue sau discrete.
Clasificare vs. regresie | |
Un model de arbore în care variabila țintă poate lua un set discret de valori. | Un model de copac unde variabila țintă poate lua valori continue, în mod tipic, numere reale. |
Variabilă dependentă | |
Pentru arborele de clasificare, variabilele dependente sunt categorice. | Pentru arborele de regresie, variabilele dependente sunt numerice. |
valori | |
Are o valoare stabilită de valori neordonate. | Are valori discrete dar ordonate sau valori indiscrete. |
Scopul construcției | |
Scopul construirii arborelui de regresie este de a se potrivi unui sistem de regresie fiecărei ramuri determinante într-un mod în care se ridică valoarea de ieșire așteptată. | Un arbore de clasificare se ramifică după cum este determinat de o variabilă dependentă derivată de la nodul anterior. |
Regresii și arborii de clasificare sunt tehnici utile pentru a evidenția procesul care indică un rezultat studiat, fie în clasificare, fie într-o singură valoare numerică. Diferența dintre arborele de clasificare și arborele de regresie este variabila lor dependentă. Arborii de clasificare au variabile dependente care sunt categorice și neordonate. Arborii de regresie au variabile dependente, care sunt valori continue sau valori întregi ordonate.
1. "Învățarea copacilor de decizie". Wikipedia, Wikimedia Foundation, 13 mai 2018. Disponibil aici
1.'Data Mining'By Arbeck - Lucrare proprie, (CC BY 3.0) vin absenta Commons Wikimedia