jest obecnie jedną z kluczowych dziedziną wiedzy w gospodarce. Sprawne przetwarzanie danych, tworzenie komunikatywnych wizualizacji i budowanie dokładnych modeli predykcyjnych odgrywają kluczową rolę w wielu procesach biznesowych. Warto przy tym pamiętać, że Data Science składa się z wielu przyległych do siebie kompetencji: pracy na danych (podobnej do tej w Excelu i SQL), znajomości statystyki matematycznej i co najmniej podstaw ekonometrii, umiejętności programowania i wiedzy z zakresu technologii informacyjnych (popularne IT), metodyki budowy, walidacji i tuningu modeli uczenia maszynowego oraz metod uprodukcyjniania modeli analitycznych w przedsiębiorstwie. Jeśli chcesz zdobyć lub poszerzyć kompetencje w wymienionych obszarach, to oferowane przez nas poniżej kursy R są dla Ciebie.

Text Mining i Web Scraping - Machine Learning

Kursy R – MasteR

Ścieżka MasteR składa się z kursów, od poziomu podstawowego do zaawansowanego. Powstała w odpowiedzi na rosnący popyt wśród firm oraz instytucji publicznych na usługi i pracowników w dziedzinie tzw. Data Science – interdyscyplinarnej analizy danych. W zakresie tej dziedziny uczymy zarówno efektywnego przetwarzania i wizualizacji danych, podstaw statystyki matematycznej, modelownia ekonometrycznego jak i budowania i walidacji modeli uczenia maszynowego (z ang. Machine Learning). Na kursach odnajdą się zarówno osoby początkujące potrzebujące rozbudowanego wprowadzenia jak i doświadczeni analitycy, którzy potrzebują uporządkować i rozszerzyć swoją wiedzę i umiejętności. 

Osobom, które nie miały wcześniej styczności z R i/lub statystyką i chcą przejść przez wszystkie kursy, sugerujemy następującą kolejność: „Analiza i wizualizacja danych w R”, następnie „Podstawy statystyki matematycznej w R”, „Zaawansowana statystyka i ekonometria w R”, „Warsztaty analityka Data Science w R”, „Warsztaty Machine Learning w R”. Kursy „Analiza i wizualizacja danych w R” oraz „Warsztaty analityka Data Science w R” to kursy typowo narzędziowe, czyli największy nacisk stawiany jest na rozwijanie umiejętności biegłej pracy w języku R, poznanie najpopularniejszych i najwydajniejszych pakietów. Natomiast kursy „Podstawy statystyki matematycznej w R”, „Zaawansowana statystyka i ekonometria w R”,  „Warsztaty Machine Learning w R”, oprócz nauki efektywnej i wydajnej pracy w R, przekazują wiedzę i umiejętności w zakresie modelowania i generowania prognoz, stawiania hipotez badawczych, walidacji i diagnostyki modeli ekonometrycznych i Machine Learning – zawsze wg aktualnego state of the art w Data Science.

Analiza i wizualizacja danych w R

Ten kurs R zaczyna się na poziomie podstawowym, ale szybko przechodzi na poziom średnio zaawansowany. Dedykowany jest przede wszystkim osobom rozpoczynającym przygodę z programem R i zaawansowaną analizą danych. Użytkownicy niemający wcześniej styczności z danymi ilościowymi (tabelami danych) powinni najpierw dobrze poznać środowisko MS Excel. Zakres kursu obejmuje zapoznanie słuchaczy ze środowiskiem R i R-Studio, przedstawienie podstawowych pakietów do efektywnego przetwarzania i prezentowania danych oraz średniozaawansowanej wizualizacji graficznej wyników badań. W programie kursu znajduje się również statystyka opisowa i elementy statystycznej analizy danych.

4,51/5,00
30 godzin dydaktycznych

Podstawy statystyki matematycznej w R

Kurs R realizowany jest od podstaw. Powstał on w wyniku analizy podręczników ze statystyki matematycznej dostępnych na rynku. Dlaczego nie można opowiedzieć tego w sposób ciekawy i intuicyjny? Dlaczego niektóre fundamentalne kwestie są przemilczane w większości książek i trzeba się ich samemu domyślać? Ten kurs jest dla Ciebie. Jeśli interesuje Cię jak dobrze skonstruować i wykonać badanie statystyczne lub po prostu chcesz poznać statystykę matematyczną od podstaw i zrozumieć wszystko od A do Z. Oprócz solidnego i szczegółowego wyjaśnienia sensu badań statystycznych, na tym kursie oferujemy solidny i szeroki przegląd podstawowych testów statystycznych – testów Z, t-Studenta, nieparametrycznych, analizy korelacji czy badanie niezależności zjawisk w tablicy kontyngencji.

4,61/5,00
30 godzin dydaktycznych

Zaawansowana statystyka i ekonometria w R

Kurs Zaawansowana statystyka i ekonometria w R realizowany jest na poziomie zaawansowanym i przeznaczony jest dla osób które mają dobrze opanowane podstawy statystyki matematycznej i posiadają praktykę w pracy z danymi. Grupą docelową są członkowie zespołów analitycznych i badawczych w firmach prywatnych instytucjach publicznych oraz na uniwersytetach, a także osoby aspirujące do takich zadań, posiadające wstępne doświadczenie m. in. w przetwarzaniu danych, których interesuje modelowanie zjawisk i wnioskowanie statystyczne. Wcześniejsza znajomość podstaw programu R jest wymagana.

4,54/5,00
30 godzin dydaktycznych

Warsztaty analityka Data Science w R

Około 70% pracy analityka polega na pozyskaniu danych i ich przygotowaniu do dalszych analiz. Czynności wykonywane w ramach tego etapu nie należą do wyrafinowanych, jednak są kluczowe dla kolejnego etapu – budowy modeli ekonometrycznych lub uczenia maszynowego (Machine Learning). Wymagają interdyscyplinarnych umiejętności: umiejętności pracy w wielu językach (np. R, SQL), znajomości technik programowania funkcyjnego i obiektowego, umiejętności optymalizacji kodu (np. obliczenia równoległe). Celem kursu „Data Science w R” jest przekazanie analitykowi danych zestawu zaawansowanych kompetencji w dziedzinie Data Science – tzw. Data Science Toolbox. 

4,57/5,00
30 godzin dydaktycznych

Warsztaty Machine Learning w R

Kurs realizowany jest na poziomie zaawansowanym, podstawowa znajomość statystyki jest wymagana. Celem kursu jest przekazanie praktycznej wiedzy o coraz popularniejszych obecnie technikach analizy ilościowej, znanych jako Machine Learning. Pozwalają one na efektywne wykorzystanie potencjału biznesowego w bazach danych gromadzonych przez przedsiębiorstwa, korporacje oraz instytucje publiczne. Zagadnienia przedstawiane są w sposób intuicyjny (a nie teoretyczny), aplikacyjny i praktyczny. Pozwala to lepiej zrozumieć sposób działania algorytmów – ich mocne strony, istniejące (niestety) ograniczenia i efektywne metody implementacji. Uczestników uczymy także o sposobach diagnostyki i oceny jakości modelu w celu wyboru najlepszej metody dla danego zbioru danych. Podczas zajęć podpowiadamy, z których narzędzi korzystać, aby zapewnić najwyższą jakość predykcji (np. bardzo popularne uśrednianie wyników z kilku modeli – ensembling). Uczymy krytycznej oceny wyników i optymalnych metod ich weryfikacji czyli state-of-the-art w coraz ważniejszej dziedzinie wiedzy i umiejętności w gospodarce: interdyscyplinarnej analizie danych – Data Science.  

5,00/5,00
30 godzin dydaktycznych