Articole pe tema statistics

Publicații conexe 'statistics'

A ramifica sau nu a ramifica: un concept de algoritm de arbore de decizie

Din când în când, o problemă complicată necesită o soluție simplă și elegantă. Structura simplă a algoritmului Decision Tree oferă o soluție puternică atât în forme de regresie, cât și de clasificare . Dar ne vom concentra doar pe forma sa de clasificare cu 2 secțiuni: Structura arborelui de decizie și Tipul de date complex. Structura arborelui decizional Să fabricăm 100 de exemple de date cu 3 caracteristici independente — „absență”, „Pe termen mediu” și „Final” și 1..

Clasificator liniar SVM în cele mai simple cuvinte

Prin acest blog vreau doar să-mi fac cititorii să înțeleagă cum funcționează un clasificator SVM în cel mai simplu mod posibil. Prin urmare, Support Vector Machine (SVM) este utilizat pentru separarea punctelor de date ale diferitelor clase prin trasarea unei granițe de decizie între clase constând din diferite puncte de date reprezentate de fiecare clasă. Limita de decizie care este creată între seturile de puncte de date este cunoscută sub numele de hiperplan , iar SVM ajută la crearea..

De la regresia liniară la regresia de creasta, lazo și rețea elastică

De la regresia liniară la regresia de creasta, lazo și rețea elastică Și de ce ar trebui să înveți tehnici alternative de regresie Introducere: Cele mai mici pătrate obișnuite („ OLS” ) este unul dintre cei mai vechi și mai simpli algoritmi utilizați pentru regresie. Cu toate acestea, acum există mai multe variante care au fost inventate pentru a aborda unele dintre slăbiciunile întâlnite atunci când se utilizează regresia regulată cu cele mai mici pătrate. În ciuda faptului că..

Distribuție normală, asimetrie și curtoză

Distribuția normală este denumită și distribuție gaussiană și este un tip de distribuție de probabilitate care este simetrică față de medie. Apare ca o curbă clopot, așa cum se arată în figura de mai jos. Coeficienții Skewness și Kurtosis măsoară cât de diferită este o distribuție dată de o „distribuție normală”. Asimetrie: Skewness măsoară simetria unei distribuții. Distribuția normală este simetrică și are o asimetrie de zero. Dacă datele au o asimetrie mai mică decât zero..

Singura teoremă pe care ar trebui să o cunoască fiecare cercetător de date

Acest articol servește ca un ghid rapid pentru una dintre cele mai importante teoreme pe care fiecare cercetător de date ar trebui să o cunoască, Teorema limită centrală . Ce este? Când nu îl poți folosi? De ce este important? Este același lucru cu legea numerelor mari? Teorema limitei centrale vs Legea numerelor mari Adesea, teorema limită centrală este confundată cu legea numerelor mari. Legea numerelor mari afirmă că, pe măsură ce dimensiunea unui eșantion crește, cu atât este..

Demistificarea învățării ansamblului: o abordare informală

În acest articol, voi încerca să demistific conceptul de Învățare prin ansamblu. Oamenii familiarizați cu Machine Learning vor fi auzit de un algoritm foarte popular numit Random Forest, care este un exemplu de învățare prin ansamblu. Voi încerca să ofer exemple și cu ajutorul lor, vom construi bazele învățării în ansamblu, încheind prin a discuta câțiva algoritmi. Deci, ce înseamnă cuvântul ansamblu? Potrivit Google, ansamblul este definit ca un „grup de articole văzute ca un întreg,..

Construiește, evaluează și interpretează propriul model de regresie liniară în câteva minute

Introducere în regresia liniară Regresia este esențială pentru multe dintre instrumentele de analiză statistică și de învățare automată pe care le folosim în calitate de oameni de știință ai datelor. Simplu spus, utilizăm tehnici de regresie pentru a modela Y prin intermediul unei anumite funcții a lui X. Derivarea acelei funcții a lui X depinde adesea în mare măsură de regresia liniară și este baza explicației sau predicției noastre. Să aruncăm o privire directă asupra modelării..