składa się z 4 kursów dla średnio zaawansowanych i zaawansowanych analityków. Powstała w odpowiedzi na rosnący popyt wśród firm oraz instytucji publicznych na usługi i pracowników w dziedzinie tzw. Data Science – interdyscyplinarnej analizy danych, ze szczególnym uwzględnieniem zagadnień dotyczących budowania i walidacji modeli uczenia maszynowego (Machine Learning). Na zajęciach, oprócz teorii i praktyki budowy modeli ML przekazujemy sposoby efektywnej pracy w programie R i RStudio. Szczególnie polecamy w tym zakresie pierwszy kurs „Warsztaty analityka Data Science w R”, na którym uczymy efektywnej pracy i technik programowania w R – kompetencji, które ogromnie przydają się w automatyzacji i przyśpieszaniu modelowania w R.

Text Mining i Web Scraping - MasteR - LabMasters

Warsztaty analityka Data Science w R

Poziom średnio zaawansowany + zaawansowany

30 godzin dydaktycznych

Zajęcia w sali komputerowej

Zaświadczenie ukończenia

Ocena kursu: 4,80/5,00 – 100% ocen pozytywnych 

Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl)

Oprogramowanie: R / R Studio

Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa)


687 zł (558,54 zł netto)

Cena zawiera m.in. certyfikat zdania egzaminu (na podstawie rozwiązanych zadań sprawdzających), zaświadczenie ukończenia kursu (na podstawie obecności), komplet materiałów w formie elektronicznej i papierowej, darmowe konsultacje (więcej).

Opis kursu

Celem kursu „Warsztaty analityka Data Science w R”, jest przekazanie uczestnikom zestawu zaawansowanych kompetencji w dziedzinie przetwarzania danych – tzw. Data Science Toolbox. Około 70% pracy analityka polega na pozyskaniu danych, czyszczeniu, transformacji i przygotowaniu do dalszych analiz. Kolejne 10% spędza na modelowaniu, a ostatnie 20% na wizualizacji wyników i ich intuicyjnym raportowaniu. Czynności wykonywane w ramach pierwszego etapu często są powtarzalne i schematyczne, a zatem można próbować je automatyzować. Z drugiej strony ich staranne wykonanie jest kluczowe w efektywnym komunikowaniu wyników otrzymanych na podstawie budowanych modeli uczenia maszynowego i ekonometrycznych.

Kluczem do sukcesu jest automatyzacja pracy. Aby móc skrócić czas od otrzymania danych do otrzymania wyników, należy rozbudować kompetencje narzędziowe w różnych dziedzinach: umiejętność pracy w wielu językach (np. R, SQL, LateX, html, javascript), znajomość technik programowania funkcyjnego i obiektowego, umiejętność optymalizacji kodu (np. obliczenia równoległe) a także wiedzę o zaawansowanych metodach wizualizacji danych. Na zajęciach prezentujemy gotowe skrypty (gotowe przepisy) do efektywnej i efektownej analizy danych. Dzięki temu Słuchacze pracują szybciej – a ich analizy zaskakują nie tylko precyzją i tempem opracowania ale i atrakcyjną stroną wizualną.

Program kursu zakłada znajomość podstaw programu R. U uczestników mile widziane jest również pewne doświadczenie w pracy z danymi. Ciężar kursu położony jest na rozwiązywanie praktycznych problemów, które napotykamy w projektach analitycznych. Kurs nawiązuje do technik uczenia maszynowego, ale ich znajomość nie jest wymagana od Słuchaczy.


Zapisy na kurs

W tym momencie rejestracja na kurs Warsztaty analityka Data Science w R jest nieaktywna. Jeżeli jesteś zainteresowany(a) wzięciem udziału w tym kursie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji. Zgłoś Mnie

Szczegółowa tematyka kursu

Elementy programowania w R.

Przegląd obiektów i systemów obiektowych, pisanie własnych funkcji, automatyzacja przetwarzania danych za pomocą funkcji w R (zadania i case study), optymalizacja i profilowanie kodu R, dobre praktyki w pisaniu kodów, modyfikacja ustawień R i RStudio,, rodzina funkcji apply, obliczenia równoległe.

Zaawansowane wczytywanie danych do R.

Przegląd opcji funkcji read*, wczytywanie złożonych i źle sformatowanych plików tekstowych, komunikacja z plikami Excela, łączenie z dużymi bazami danych (pakiety bigmemory i ff), wczytywanie danych z SAS, SPSS i innych pakietów (pakiety: haven i rio), wczytywanie dat i czasu oraz efektywna obróbka dat w R (pakiet lubridate).

Zaawansowane przetwarzanie danych.

Obróbka danych tekstowych w pakietach stringr i lubridate, wykorzystanie wyrażeń regularnych, wykonywanie operacji w pętlach (instrukcje kończące się na _all, _if, _at), złożone i wieloetapowe przetwarzanie tabel danych, automatyzacja przetwarzania danych w pakietach caret, mlr, recipe. Techniki imputacji danych (w tym wykorzystywanie modelu regresyjnego i uczenia maszynowego do imputacji braków danych).

Wykorzystanie języka SQL i łączenie z zewnętrznymi bazami danych w R.

Pakiety sqldf, ODBC, RDBC, SQLite – łączenie z bazami SQL (MS SQL Server i Access).

Zaawansowana wizualizacja danych (w pakiecie ggplot2).

Przegląd złożonych wykresów, tworzenie wykresów zagnieżdżonych, tworzenie własnych wykresów na bazie istniejących geometrii, zaawansowany R Markdown i wprowadzenie do pakietu Shiny.


Czego się nauczysz

Dzięki kursowi Warsztaty analityka Data Science w R poznasz program R w stopniu zaawansowanym. Będziesz potrafił projektować krótkim czasie przetwarzać wyjściowe, nieoczyszczone i nieustrukturyzowane dane do postaci gotowej do dalszych analiz (statystycznych, ekonometrycznych bądź Machine Learning). Poznasz techniki przyśpieszania pracy w programie R (m. in. optymalizacja kodu i przetwarzanie równoległe). Nauczymy Cię również programować w R, dzięki czemu będziesz mógł automatyzować powtarzalne czynności. Dodatkowo, poznasz funkcje i metody pracy na danych tekstowych i będziesz umiał wykorzystywać w praktyce siłę wyrażeń regularnych. Na kursie przekazujemy również o nietypowych i zaawansowanych metodach wizualizacji danych, dzięki czemu Twoje prezentacje i raporty będą przyciągać także od strony wizualnej, nie tylko merytorycznej.

Opinie uczestników

„Bardzo dobrze przygotowane poruszone zagadnienia. Materiał z kursu jest must have w pracy, która wymaga bardzo dobrej znajomości R. POLECAM!”


„widać ogrom wiedzy i umiejętność jej przekazywania :)”


„Prowadzący jest bardzo profesjonalny, w bardzo ciekawy i jasny sposób tłumaczy zagadnienia poruszane na zajęciach.”


„+ ogrom materiałów i ćwiczeń ; prowadzący przykładający się do jak najlepszych odpowiedzi na pytania i wątpliwości”


„Bardzo wysoko oceniam kurs, prowadzenie, przygotowanie, tematykę zajęć”


„Kurs bardzo dobry, a zagadnienia są wykorzystywane w codziennej pracy na dużych zbiorach danych.”


„Wysoka jakość merytoryczna i dostosowanie do potrzeb biznesowych.


„Po prostu super!!”


„Bardzo dobry, kompetentny prowadzący. Materiały bardzo przydatne.”