Publicații conexe 'statistics'


Gatekeeping și elitism în știința datelor
Dacă sunt sincer, de multe ori simt că trebuie să arăt că sunt mai bun decât alți oameni. Pot fi mai ales egoist când vine vorba de lucruri în jurul cărora mi-am construit identitatea, lucruri de care sunt foarte mândru, lucruri care îmi oferă un sentiment de valoare de sine, oricât de superficială ar fi. Așa că atunci când întâlnesc elitism și snob, gatekeeping intelectual în domeniul științei datelor, înțeleg perfect. Când aud oameni care își petrec cea mai mare parte a timpului..

Explorarea complexității analizei datelor
În timpul analizei statistice a datelor, întâlnim adesea situații încurcate, în care adevărul poate să nu fie atât de clar pe cât pare. Analiza datelor necesită o analiză atentă, deoarece perspective diferite pot duce la concluzii contrastante. Prin urmare, este important să examinăm datele din toate unghiurile înainte de a trage orice concluzie. Să ne adâncim în lumea paradoxurilor, analizând câteva exemple din viața reală care evidențiază importanța analizei amănunțite a datelor...

Corelația VS Covarianța: calea ușoară
Corelația VS Covarianța: calea ușoară Bună ziua tuturor. Aceasta este a doua mea postare din seria Machine Learning, unde încerc să explic conceptele de machine learning în termeni profani. Vom discuta despre o întrebare populară de interviu de învățare automată „ care este diferența dintre corelație și covarianță ?” Vom încerca să găsim cel mai simplu răspuns la întrebare. În timp ce atât corelația, cât și covarianța măsoară relația și dependența dintre două variabile, acestea..

De la continuu la categorial: regresia logistică explorată — Săptămâna 3, ziua 17
Salutări, pasionat de date! Bun venit în ziua 17 a seriei noastre „Python pentru știința datelor: 100 de zile până la stăpânire”. Bazându-ne pe înțelegerea noastră despre regresia liniară din Ziua 16, astăzi trecem la regresia logistică - un instrument esențial pentru sarcinile de clasificare. Până la sfârșitul sesiunii noastre, veți fi stăpânit conceptul și implementarea practică a regresiei logistice folosind Python. Regresia logistică: un primer În timp ce regresia liniară este..

Măsura variabilității
Termenii „măsura variabilității” și „măsurarea dispersiei” sunt folosiți interschimbabil în statistici. Ambele se referă la același concept, care este cuantificarea răspândirii sau împrăștierii punctelor de date într-un set de date. Măsurile de variabilitate sau dispersie furnizează informații despre modul în care punctele de date sunt distribuite în jurul unei măsuri de tendință centrală (cum ar fi media, mediana sau modul) și oferă o indicație despre răspândirea sau măsura în care..

Cum să evitați să fiți păcălit de precizia modelului
Un ghid vizual pentru valorile modelului de clasificare binar și utilizarea corectă a acestora Fundal — Simplu la suprafață Valorile utilizate pentru măsurarea performanței modelelor de clasificare sunt destul de simple, cel puțin din punct de vedere matematic. Cu toate acestea, am observat că mulți modelatori și oameni de știință de date întâmpină dificultăți în articularea acestor metrici și chiar le aplică incorect. Aceasta este o greșeală ușor de făcut, deoarece aceste metrici..

Ce este Bootstrapping-ul în învățarea automată ?
Majoritatea statisticilor se ocupă de compararea a două lucruri și de a determina dacă acestea sunt diferite în realitate sau doar că am observat aleatoriu o diferență în eșantionul pe care l-am adunat, dar în realitate nu există nicio diferență. Acesta este ceea ce face ca statisticile să fie atât de interesante. De exemplu, este performanța lui iPhone13 cu adevărat mai bună decât a lui iPhone10? Sau modelul de învățare automată pe care l-am construit este cu adevărat mai bun decât..