Poziom: średnio zaawansowany + zaawansowany 30 godzin dydaktycznych Zajęcia zdalne lub stacjonarne w sali komputerowej Zaświadczenie ukończenia Ocena kursu: 4,56/5,00 – 93% ocen co najmniej 4 (w skali od 1 do 5) Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl) Oprogramowanie: Python / Jupyter Notebook Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa) |
Opis kursu
Kurs „Warsztaty Machine Learning w Pythonie”, jest prowadzony na poziomie średniozaawansowanym i zaawansowanym. Wymagana jest podstawowa znajomość statystyki i podstawowa znajomość języka Python (na przykład zdobyta na kursie: https://labmasters.pl/kursy-otwarte/python/p-1/). Celem jest przekazanie umiejętności budowania modeli predykcyjnych w obszarze Data Science z wykorzystaniem technik uczenia maszynowego (z ang. Machine Learning). Na zajęciach uczymy w sposób intuicyjny teoretycznych podstaw modelu, silnych i słaby stron każdej metody i na praktycznych przykładach przekazujemy umiejętność wykorzystania modeli w praktyce. Ponadto, uczestnicy dowiadują się jak interpretować i oceniać modele oraz poprawnie wykonywać walidować krzyżową. Prowadzący przekazują praktyczną wiedzę opartą o doświadczenie biznesowe zdobyte w projektach consultingowych. Uczestnik kursu otrzymuje obszerne materiały, zawierające kody i procedury do natychmiastowego wykorzystania w postaci gotowych receptur we własnych analizach.
W trakcie warsztatów zajęcia podzielone są na część wykładową (ok. 40% zajęć), ćwiczeniową (ok. 40%, prezentacja i interpretacja kodów w Pythonie) i pracę własną uczestników (20%) – polegającą na rozwiązywaniu biznesowych case study przygotowanych przez Prowadzącego. Podczas części ćwiczeniowej nacisk położony jest na poznanie efektywnych metod przetwarzania danych oraz programowania w środowisku Python. Po warsztatach uczestnik posiada wiedzę i umiejętności wystarczające do samodzielnej pracy i rozwoju w środowisku Python na poziomie zaawansowanym.
Zapisy
Rejestracja na kurs jest aktywna
Termin: 15.10-31.10.2024, wtorki i czwartki w godz. 16:30-20:30.
Daty zajęć: 15.10, 17.10, 22.10, 24.10, 29.10, 31.10.
Stan zapisów: rejestracja aktywna do 14.10.2024 do godz. 7:00 lub do wyczerpania miejsc.
Uwaga: ta edycja kursu realizowana jest jedynie w formie zdalnej.
Zgłoś zainteresowanie
Jeżeli jesteś zainteresowany(a) wzięciem udziału w kursie realizowanym na żywo w innym terminie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji.
Tematyka kursu
Metodologia budowy modelu ML
Podstawowe pojęcia uczenia maszynowego. Omówienie różnych miar jakości prognoz dla zmiennej ciągłej i dyskretnej i ich interpretacja biznesowa. Walidacja krzyżowa i jej rola w ocenie jakości modelu, tuningu hiperparametrów oraz wykrywaniu i przeciwdziałaniu przetrenowania modeli. Strategie tuningu hiperparametrów (grid search, random search i porównanie z metodami zaawansowanymi). Przykłady inżynierii zmiennych (feature generation i feature selection). Budowa własnego pipeline’u analitycznego do walidacji krzyżowej modeli w oparciu o bibliotekę scikit-learn. Gotowe przykłady i tutoriale w sklearn.
Uczenie nadzorowane – przegląd modeli
Regresja liniowa i logistyczna, SVM (liniowy, wielomianowy, RBF), KNN, NaiveBayes, drzewa regresyjne i klasyfikacyjne, ensembling modeli: stacking/blending, bagging, lasy losowe (random forest oraz Extremely Randomized Trees) i boostowane drzewa decyzyjne (przegląd implementacji: XGBoost, LightGBM, Catboost). Przegląd technik tuningu hiperparametrów – grid search, random search, techniki zaawansowane (m. in. Bayesian optimasation search) i ich implementacje w pakietach optuna oraz bayes_opt. Dobre praktyki tuningu hiperparametrów. Omówienie mocnych i słabych stron poszczególnych modeli. Kryteria doboru modelu do problemu badawczego. Gotowe przykłady i tutoriale w sklearn.
Uczenie nienadzorowane.
Segmentacja zbioru danych – przegląd modeli (m. in. metody hierarchiczne, k-means, PAM, DBSCAN) , redukcja wymiarów za pomocą (PCA, t-SNE). Kryteria doboru modelu do problemu badawczego. Przykłady inżynierii zmiennych (feature generation i feature selection). Gotowe przykłady i tutoriale w sklearn.
Czego się nauczysz
Na kursie Warsztaty Machine Learning w Pythonie, nauczysz się analizować i modelować dane na poziomie zaawansowanym. Między innym będziesz potrafił dobierać właściwe techniki i algorytmy do problemu badawczego, wybierać najlepsze modele predykcyjne za pomocą walidacji krzyżowej, dokonywać tuningu hiperparametrów, ograniczać ryzyko przetrenowania modelu przez regularyzację i ensembling modeli. Poznasz najskuteczniejsze algorytmy uczenia maszynowego do modelowania i prognozowania zmiennych ciągłych i dyskretnych. Będziesz potrafił zastosować metody Machine Learning.