składa się z 3 kursów dla średnio zaawansowanych i zaawansowanych analityków. Powstała w odpowiedzi na rosnący popyt wśród firm oraz instytucji publicznych na usługi i pracowników w dziedzinie tzw. Data Science – interdyscyplinarnej analizy danych, ze szczególnym uwzględnieniem zagadnień dotyczących budowania i walidacji modeli uczenia maszynowego (Machine Learning). Na zajęciach, oprócz teorii i praktyki budowy modeli ML przekazujemy sposoby efektywnej pracy w programie R i RStudio. Szczególnie polecamy w tym zakresie pierwszy kurs „Warsztat analityka Data Science w R”, na którym uczymy efektywnej pracy i technik programowania w R – kompetencji, które ogromnie przydają się w automatyzacji i przyśpieszaniu modelowania w R.

Machine Learning - MasteR - LabMasters

Warsztaty analityka Data Science w R

Poziom średnio zaawansowany + zaawansowany

30 godzin dydaktycznych

Zajęcia w sali komputerowej

Zaświadczenie ukończenia

Ocena kursu: 4,57/5,00 – 100% ocen pozytywnych

Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl)

Oprogramowanie: R Project / R Foundation

Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa)


687 zł
(558,54 zł netto)

Cena zawiera m.in. certyfikat zdania egzaminu (na podstawie rozwiązanych zadań sprawdzających), zaświadczenie ukończenia kursu (na podstawie obecności), komplet materiałów w formie elektronicznej i papierowej, darmowe konsultacje (więcej).

Opis kursu

Celem kursu Warsztaty analityka Data Science w R, jest przekazanie uczestnikom zestawu zaawansowanych kompetencji w dziedzinie przetwarzania danych – tzw. Data Science Toolbox. Program kursu zakłada znajomość podstaw programu R, u uczestników mile widziane jest również pewne doświadczenie w pracy z danymi, ponieważ ciężar kursu położony jest na rozwiązywanie praktycznych problemów, które napotykamy w projektach analitycznych.

Około 70% pracy analityka polega na pozyskaniu danych, czyszczeniu, transformacji i przygotowaniu do dalszych analiz. Kolejne 10% spędza na modelowaniu a ostatnie 20% na wizualizacji wyników i ich intuicyjnym raportowaniu. Czynności wykonywane w ramach pierwszego i ostatniego etapu często nie należą do skomplikowanych, jednak ich staranne wykonanie jest kluczowe dla budowy i efektywnym komunikowaniu wyników otrzymanych na podstawie budowanych modeli uczenia maszynowego i ekonometrycznych . Przetwarzanie i wizualizacja danych jest też relatywnie łatwa w automatyzacji – warto zainwestować trochę czasu na optymalizację czasu wykonywania i parametryzację skryptów. Na tych etapach opłaca się mieć kompetencje w różnych dziedzinach: umiejętność pracy w wielu językach (np. R, SQL, LateX, html, javascript), znajomość technik programowania funkcyjnego i obiektowego, umiejętność optymalizacji kodu (np. obliczenia równoległe) a także wiedzę o zaawansowanych metodach wizualizacji danych.


Rejestracja na kurs jest aktywna

Termin: 09.01.2019-25.01.2019, środy i piątki w godz. 16.40-20.40
Daty zajęć: 09.01, 11.01, 16.01, 18.01, 23.01, 25.01
Stan zapisów: trwa rejestracja

Zapisz Mnie


Zapisy do innych grup

W tym momencie rejestracja na kurs Warsztaty analityka Data Science w R w innym terminie jest nieaktywna. Jeżeli jesteś zainteresowany(a) wzięciem udziału w tym kursie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji.
Zgłoś Mnie

Szczegółowa tematyka kursu

Zaawansowane wczytywanie danych do R.

Przegląd opcji funkcji read*, wczytywanie złożonych i źle sformatowanych pliki tekstowe, komunikacja z plikami Excela, łączenie z dużymi bazami danych (pakiety bigmemory i ff), wczytywanie danych z SAS, SPSS i innych pakietów (pakiety: haven i rio), wczytywanie dat i czasu oraz efektywna obróbka dat w R (pakiet lubridate).

Zaawansowane przetwarzanie danych w pakiecie dplyr i tidyr.

Wykonywanie operacji w pętlach (instrukcje kończące się na _all, _if, _at), wywoływanie komend w standardowej ewaluacji (funkcje zakończone „_”), złożone i wieloetapowe przetwarzanie tabel danych, automatyzacja przetwarzania danych w pakietach caret, mlr, recipe.

Operacje na datach i tekstach w R.

Pakiety stringr, lubridate, wykorzystanie wyrażeń regularnych.

Wykorzystanie języka SQL w R.

Pakiety sqldf, ODBC, RDBC, SQLite – łączenie z bazami SQL (MS SQL Server i Access).

Imputacja danych w R.

Pakiet mice, simputation, wykorzystywanie modelu regresyjnego i uczenia maszynowego do imputacji braków danych.

Zaawansowana wizualizacja danych (w pakiecie ggplot2).

Przegląd złożonych wykresów, tworzenie wykresów zagnieżdżonych, tworzenie własnych wykresów na bazie istniejących geometrii.

Elementy programowania w R.

Przegląd obiektów i systemów obiektowych, pisanie własnych funkcji, programowanie defensywne, optymalizacja kodu, rodzina funkcji apply, obliczenia równoległe, wprowadzenie do pakietu Rcpp.


Czego się nauczysz

Dzięki kursowi Warsztaty analityka Data Science w R poznasz program R w stopniu zaawansowanym. Będziesz potrafił projektować i wykonywać szybko i efektywnie przekształcać wyjściowe, nieoczyszczone i nieustrukturyzowane dane do postaci gotowej do dalszych analiz. Poznasz techniki przyśpieszania pracy w programie R (m. in. przetwarzanie równoległe). Nauczymy Cię również programować w R, w celu automatyzacji Twoich analiz w R. Dodatkowo, poznasz funkcje i metody pracy na danych tekstowych i będziesz umiał wykorzystywać w praktyce złożone wyrażenia regularne. Na kursie przekazujemy również wiedzę o pakietach i funkcjach automatyzujących powtarzalne czynności w procesach analitycznych określanych mianem Data Science.