P3 - Warsztaty Machine Learning w Pythonie

Poziom: średnio zaawansowany + zaawansowany

30 godzin dydaktycznych

Zajęcia zdalne lub stacjonarne w sali komputerowej

Zaświadczenie ukończenia

Ocena kursu: 4,56/5,00 – 93% ocen co najmniej 4 (w skali od 1 do 5)

Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl)

Oprogramowanie: Python / Jupyter Notebook

Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa)

Opis kursu

Kurs „Warsztaty Machine Learning w Pythonie”, jest prowadzony na poziomie średniozaawansowanym i zaawansowanym. Wymagana jest podstawowa znajomość statystyki i podstawowa znajomość języka Python (na przykład zdobyta na kursie: https://labmasters.pl/kursy-otwarte/python/p-1/). Celem jest przekazanie umiejętności budowania modeli predykcyjnych w obszarze Data Science z wykorzystaniem technik uczenia maszynowego (z ang. Machine Learning). Na zajęciach uczymy w sposób intuicyjny teoretycznych podstaw modelu, silnych i słaby stron każdej metody i na praktycznych przykładach przekazujemy umiejętność wykorzystania modeli w praktyce. Ponadto, uczestnicy dowiadują się jak interpretować i oceniać modele oraz poprawnie wykonywać walidować krzyżową. Prowadzący przekazują praktyczną wiedzę opartą o doświadczenie biznesowe zdobyte w projektach consultingowych. Uczestnik kursu otrzymuje obszerne materiały, zawierające kody i procedury do natychmiastowego wykorzystania w postaci gotowych receptur we własnych analizach.

W trakcie warsztatów zajęcia podzielone są na część wykładową (ok. 40% zajęć), ćwiczeniową (ok. 40%, prezentacja i interpretacja kodów w Pythonie) i pracę własną uczestników (20%) – polegającą na rozwiązywaniu biznesowych case study przygotowanych przez Prowadzącego. Podczas części ćwiczeniowej nacisk położony jest na poznanie efektywnych metod przetwarzania danych oraz programowania w środowisku Python. Po warsztatach uczestnik posiada wiedzę i umiejętności wystarczające do samodzielnej pracy i rozwoju w środowisku Python na poziomie zaawansowanym.

Zapisy

Zgłoś zainteresowanie

Planowany termin: wrzesień-listopad 2024. Jeżeli jesteś zainteresowany(a) wzięciem udziału w tym kursie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji.

Zgłoś Mnie

Tematyka kursu

Metodologia budowy modelu ML

Podstawowe pojęcia uczenia maszynowego. Omówienie różnych miar jakości prognoz dla zmiennej ciągłej i dyskretnej i ich interpretacja biznesowa. Walidacja krzyżowa i jej rola w ocenie jakości modelu, tuningu hiperparametrów oraz wykrywaniu i przeciwdziałaniu przetrenowania modeli. Strategie tuningu hiperparametrów (grid search, random search i porównanie z metodami zaawansowanymi). Przykłady inżynierii zmiennych (feature generation i feature selection). Budowa własnego pipeline’u analitycznego do walidacji krzyżowej modeli w oparciu o bibliotekę scikit-learn.

Uczenie nadzorowane – przegląd modeli

Regresja liniowa i logistyczna, SVM (liniowy, wielomianowy, RBF), KNN, NaiveBayes, drzewa regresyjne i klasyfikacyjne, ensembling modeli: stacking, bagging, lasy losowe (random forest) i boostowane drzewa decyzyjne (według implementacji XGBoost). Omówienie implementacji modeli w bibliotece scikit-learn oraz xgboost. Dobre praktyki tuningu hiperparametrów. Omówienie mocnych i słabych stron poszczególnych modeli. Kryteria doboru modelu do problemu badawczego.

Uczenie nienadzorowane.

Segmentacja zbioru danych – przegląd modeli (m. in. metody hierarchiczne, k-means, PAM, DBSCAN) , redukcja wymiarów za pomocą (PCA, t-SNE). Kryteria doboru modelu do problemu badawczego. Przykłady inżynierii zmiennych (feature generation i feature selection).

Czego się nauczysz

Na kursie Warsztaty Machine Learning w Pythonie, nauczysz się analizować i modelować dane na poziomie zaawansowanym. Między innym będziesz potrafił dobierać właściwe techniki i algorytmy do problemu badawczego, wybierać najlepsze modele predykcyjne za pomocą walidacji krzyżowej, dokonywać tuningu hiperparametrów, ograniczać ryzyko przetrenowania modelu przez regularyzację i ensembling modeli. Poznasz najskuteczniejsze algorytmy uczenia maszynowego do modelowania i prognozowania zmiennych ciągłych i dyskretnych. Będziesz potrafił zastosować metody Machine Learning.

Opinie uczestników

„Sposób prowadzenia bardzo przystępny, nastawiony na zastosowanie i dalszą samodzielną pracę.”

„Kurs był dla mnie bardzo wartościowy, na pewno przerobi e wszystkie materiały i zastosuje w praktyce.”

„Super prowadzący.”

„Z przyjemnością wrócę na inne kursy.”

„To mój pierwszy kurs z tego zakresu i jak dla mnie to rewelacja a w szczególności połączenie informacji z zakresu statystyki i ekonometrii z pythonem.”

„Bardzo duży zakres wiedzy teoretycznej: zarówno w kwestii materiałów jak i kodów. Wiedza teoretyczna przekazywana w sposób jasny i zrozumiały.”

„Polecam”

„Bardzo fajne, w dobrych warunkach (ogromny plus za sale – wreszcie nie jest duszno, może trzeba lepiej dopasować oświetlenie oraz wielkość tekstu wyświetlanego?), świetnie tłumaczone, dużo wiedzy w pigułce.”