składa się z 3 kursów dla średnio zaawansowanych i zaawansowanych analityków. Powstała w odpowiedzi na rosnący popyt wśród firm oraz instytucji publicznych na usługi i pracowników w dziedzinie tzw. Data Science – interdyscyplinarnej analizy danych, ze szczególnym uwzględnieniem zagadnień dotyczących budowania i walidacji modeli uczenia maszynowego (Machine Learning). Na zajęciach, oprócz teorii i praktyki budowy modeli ML przekazujemy sposoby efektywnej pracy w programie R i RStudio. Szczególnie polecamy w tym zakresie pierwszy kurs „Warsztat analityka Data Science w R”, na którym uczymy efektywnej pracy i technik programowania w R – kompetencji, które ogromnie przydają się w automatyzacji i przyśpieszaniu modelowania w R.

Machine Learning - MasteR - LabMasters

Warsztaty Machine Learning w R cz. 1

Poziom zaawansowany

30 godzin dydaktycznych

Zajęcia w sali komputerowej

Zaświadczenie ukończenia

Ocena kursu: 4,44/5,00 – 93% ocen pozytywnych

Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl)

Oprogramowanie: R Project / R Foundation

Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa)


687 zł
(558,54 zł netto)

Cena zawiera m.in. certyfikat zdania egzaminu (na podstawie rozwiązanych zadań sprawdzających), zaświadczenie ukończenia kursu (na podstawie obecności), komplet materiałów w formie elektronicznej i papierowej, darmowe konsultacje (więcej).

Opis kursu

Kurs Warsztaty Machine Learning w R, na poziomie zaawansowanym. Wymagana jest podstawowa znajomość statystyki. Celem kursu jest przekazanie praktycznej wiedzy o bardzo popularnych obecnie technikach analizy ilościowej znanych jako Machine Learning. Pozwalają one na efektywne wykorzystanie potencjału biznesowego leżącego w bazach danych gromadzonych przez przedsiębiorstwa, korporacje i instytucje publiczne.

Na zajęciach zagadnienia przedstawiane są w sposób intuicyjny (a nie teoretyczny), aplikacyjny i praktyczny co pozwala lepiej zrozumieć sposób działania algorytmów uczenia maszynowego. Ich mocne strony i słabe strony, istniejące (niestety) ograniczenia i efektywne metody implementacji. Uczestnicy dowiadują się w trakcie zajęć o poprawnej interpretacji wyników modelu, diagnostyce modelu, ocenie jakości prognostycznej (walidacja krzyżowa) oraz kryteriach wyboru najlepszego do danego problemu badawczego.

Podczas zajęć podpowiadamy, z których narzędzi korzystać, aby zapewnić sobie najwyższą jakość predykcji (np. bardzo popularne uśrednianie wyników z kilku modeli –ensembling), uczymy krytycznej oceny wyników i poprawnej, wiarygodnej walidacji modeli – czyli state-of-the-art w coraz ważniejszej dla gospodarki dziedzinie wiedzy: interdyscyplinarnej analizie danych – Data Science.


Rejestracja na kurs jest aktywna

Termin: 08.01.2019-24.01.2019, wtorki i czwartki w godz. 16.40-20.40
Daty zajęć: 08.01, 10.01, 15.01, 17.01, 22.01, 24.01
Stan zapisów: trwa rejestracja

Zapisz Mnie


Zapisy do innych grup

W tym momencie rejestracja na kurs w innym terminie jest nieaktywna. Jeżeli jesteś zainteresowany(a) wzięciem udziału w tym kursie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji.
Zgłoś Mnie

Szczegółowa tematyka kursu

Wprowadzenie do Data Science.

Cel i zakres dziedziny, przegląd metod i zastosowań, przegląd pakietów R-owych do Machine Learning, przegląd bibliografii oraz omówienie roli uczenie maszynowego w procesach analizy danych.

Zagadnienia ogólne w Machine Learning.

Kryteria oceny jakości modeli, interpretacja i wizualizacja wyników, intuicyjne i praktyczne przedstawienie zasad działania, mocnych i słabych stron oraz przeznaczenia każdego z modeli. Omówienie procesu walidacji krzyżowej i jej roli w ocenie jakości prognoz modeli uczenia maszynowego, wykrywaniu i zwalczaniu przetrenowania modelu oraz optymalizacji wartości hiperparametrów oraz wyboru najlepszego algorytmu do generowania predykcji w konkretnym problemie badawczym.

Predykcja zmiennej ciągłej.

Regresja liniowa, przegląd technik regularyzacji równań liniowych: regresja grzbietowa (ridge regression, L2), LASSO (L1), Elastic Net, (L1/L2), Partial Least Squares (PLS), Principal Component Regression (PCR), Least Angle Regression (LARS). Wykorzystanie drzewa regresyjnych do modelowania zmiennej ciągłej. Przegląd zaawansowanych technik regresyjnych do modelowania nieliniowości. General Additive Models (GAM), MARS/EARTH (Multivariate Adaptive Regression Splines) oraz regresja lokalna (LOWESS i LOESS).

Metody klasyfikacyjne w uczeniu maszynowym.

Regresja logistyczna, wielomianowa regresja logistyczna, metoda najbliższych sąsiadów (kNN), naiwne podejście bayesowskie (naive bayes), drzewa decyzyjne i reguły decyzyjne, maszyna wektorów nośnych (Support Vector Machine – SVM). Liniowa i kwadratowa analiza dyskryminacji (LDA, QDA), lasy losowe (Random Forest) oraz wprowadzenie do “zwiększonych drzew decyzyjnych (boosting, boosted trees).

Techniki uczenia nienadzorowanego.

Redukcja wymiarów (analiza PCA, MDS, ICA), techniki klastrowania (hierarchiczne, niehierarchiczne, oraz metody zaawansowane: m. in. klastrowanie rozmyte, DB-SCAN oraz EM algorithms), analiza koszykowa (Market Basket Analysis) i wprowadzenie do systemów rekomendacyjnych.


Czego się nauczysz

Rezultatem tego kursu Warsztaty Machine Learning w R będzie zaznajomienie Cię z problematyką uczenia maszynowego czyli problemem przetrenowania modelu, budowaniem skutecznych modeli za pomocą walidacji krzyżowej, doborem właściwej techniki i tuningiem jej hiperparametrów. Poznasz najskuteczniejsze algorytmy uczenia maszynowego do modelowania i prognozowania zmiennych ciągłych i dyskretnych. Będziesz potrafił zastosować metody Machine Learning do specyfiki różnych zbiorów danych. Nauczymy Cię w optymalny sposób programować i implementować analizy statystyczne w środowisku R i RStudio.

Opinie uczestników

„Ogrom przekazanej wiedzy.”


„Wiedza i doświadczenie prowadzącego jest bezcenne – tego co wie prowadzący nie można się już dowiedzieć samemu w domu :)”


„Kurs warty każdych pieniędzy:)”


„Genialny prowadzący!”