Poziom: średnio zaawansowany + zaawansowany 30 godzin dydaktycznych Zajęcia w sali komputerowej Zaświadczenie ukończenia Ocena kursu: 4,72/5,00 – 94% ocen co najmniej 4 (w skali od 1 do 5) Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl) Oprogramowanie: Python / Jupyter Notebook Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa) |
Opis kursu
Kurs „Warsztaty Machine Learning w Pythonie”, jest prowadzony na poziomie średniozaawansowanym i zaawansowanym. Wymagana jest podstawowa znajomość statystyki i podstawowa znajomość języka Python (na przykład zdobyta na kursie: https://labmasters.pl/kursy-otwarte/python/p-1/). Celem jest przekazanie umiejętności budowania modeli predykcyjnych w obszarze Data Science z wykorzystaniem technik uczenia maszynowego (z ang. Machine Learning). Na zajęciach uczymy w sposób intuicyjny teoretycznych podstaw modelu, silnych i słaby stron każdej metody i na praktycznych przykładach przekazujemy umiejętność wykorzystania modeli w praktyce. Ponadto, uczestnicy dowiadują się jak interpretować i oceniać modele oraz poprawnie wykonywać walidować krzyżową. Prowadzący przekazują praktyczną wiedzę opartą o doświadczenie biznesowe zdobyte w projektach consultingowych. Uczestnik kursu otrzymuje obszerne materiały, zawierające kody i procedury do natychmiastowego wykorzystania w postaci gotowych receptur we własnych analizach.
W trakcie warsztatów zajęcia podzielone są na część wykładową (ok. 40% zajęć), ćwiczeniową (ok. 40%, prezentacja i interpretacja kodów w Pythonie) i pracę własną uczestników (20%) – polegającą na rozwiązywaniu biznesowych case study przygotowanych przez Prowadzącego. Podczas części ćwiczeniowej nacisk położony jest na poznanie efektywnych metod przetwarzania danych oraz programowania w środowisku Python. Po warsztatach uczestnik posiada wiedzę i umiejętności wystarczające do samodzielnej pracy i rozwoju w środowisku Python na poziomie zaawansowanym.
Zapisy
Zgłoś zainteresowanie
Jeżeli jesteś zainteresowany(a) wzięciem udziału w tym kursie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji.
Tematyka kursu
Metodologia budowy modelu ML
Podstawowe pojęcia uczenia maszynowego. Omówienie różnych miar jakości prognoz dla zmiennej ciągłej i dyskretnej i ich interpretacja biznesowa. Walidacja krzyżowa i jej rola w wyborze i ocenie jakości modelu, wykrywanie i przeciwdziałanie przetrenowaniu modelu, ograniczenie ryzyka przetrenowania modelu przez regularyzację. Techniki i strategie tuningu hiperparametrów. Przykłady feature engineering i feature selection. Budowa własnego pipeline’u analitycznego do walidacji krzyżowej modeli w oparciu o bibliotekę scikit-learn.
Uczenie nadzorowane – przegląd modeli
Regresja liniowa i logistyczna, KNN, NaiveBayes, drzewa regresyjne I klasyfikacyjne, SVM, ensembling modeli: stacking, bagging, lasy losowe (random forest) i boostowane drzewa decyzyjne (według implementacji XGBoost). Omówienie implementacji modeli w bibliotece scikit-learn i praktyczne przykłady modelowania. Dobre praktyki tuningu hiperparametrów. Mocne i słabe strony poszczególnych modeli. Kryteria doboru modelu do problemu badawczego.
Uczenie nienadzorowane.
Segmentacja zbioru danych – przegląd modeli (m. in. metody hierarchiczne, k-means, PAM, DBSCAN) , redukcja wymiarów za pomocą (PCA, t-SNE). Kryteria doboru modelu do problemu badawczego. Przykłady feature engineering i feature selection.
Czego się nauczysz
Na kursie Warsztaty Machine Learning w Pythonie, nauczysz się analizować i modelować dane na poziomie zaawansowanym. Między innym będziesz potrafił dobierać właściwe techniki i algorytmy do problemu badawczego, wybierać najlepsze modele predykcyjne za pomocą walidacji krzyżowej, dokonywać tuningu hiperparametrów, ograniczać ryzyko przetrenowania modelu przez regularyzację i ensembling modeli. Poznasz najskuteczniejsze algorytmy uczenia maszynowego do modelowania i prognozowania zmiennych ciągłych i dyskretnych. Będziesz potrafił zastosować metody Machine Learning.