Diferență între clasificare și regresie

Anonim

Clasificarea vs. Regresie

Clasificarea și regresia sunt tehnici de învățare pentru a crea modele de predicție din datele colectate. Ambele tehnici sunt reprezentate grafic ca arbori de clasificare și de regresie sau, mai degrabă, diagrame cu diviziuni de date după fiecare pas sau, mai degrabă, "ramură" în arbore. Acest proces se numește partiționare recursivă.

Clasificare

Clasificarea este o tehnică folosită pentru a ajunge la o schemă care arată organizarea datelor începând cu o variabilă precursor. Variabilele dependente sunt ceea ce clasifică datele în grupuri. Arborele de clasificare începe cu variabila independentă, care se prefigurează în două grupe determinate de variabilele dependente existente. Se intenționează elucidarea răspunsurilor sub forma clasificării aduse de variabilele dependente.

- <->

Regresia

Regresia este o metodă de predicție care se bazează pe o valoare de ieșire numerică presupusă sau cunoscută. Această valoare de ieșire este rezultatul unei serii de partiții recursive, fiecare pas având o valoare numerică și un alt grup de variabile dependente care se extind spre o altă pereche, cum ar fi aceasta. Arborele de regresie începe cu una sau mai multe variabile precursor și se termină cu o variabilă de ieșire finală. Variabilele dependente sunt variabile numerice continue sau discrete.

Care este diferența dintre clasificare și regresie

Principala diferență dintre arborele de clasificare și arborele de regresie este variabila lor dependentă. Pentru arborele de clasificare, variabilele dependente sunt categorice, în timp ce arborele de regresie are variabile dependente numeric. Cei din arborele de clasificare au, de asemenea, o valoare stabilită de valori neordonate, iar cele ale arborelui de regresie au fie valori discrete dar și ordonate sau valori indiscrete. Un arbore de regresie este construit cu scopul de a monta un sistem de regresie la fiecare ramificație determinantă într-un mod care să aducă valoarea de ieșire așteptată. Pe de altă parte, un arbore de clasificare ramifică după cum este determinat de o variabilă dependentă derivată din nodul anterior.

Arborii de regresie și de clasificare sunt tehnici utile pentru a identifica procesul care indică un rezultat studiat, fie în clasificare, fie într-o singură valoare numerică.

Pe scurt:

• Arborii de clasificare au variabile dependente care sunt categorice și neordonate.

• Arborii de regresie au variabile dependente, care sunt valori continue sau ordine întregi.