Analiza i wizualizacja danych w R - elearning

690 zł*
*Podana cena kursu jest ceną:

  • brutto (zawiera podatek VAT 23%), jeśli zakupu dokonują osoby fizyczne nie prowadzące działalności gospodarczej;
  • netto (nie zawiera podatku VAT 23% – cena brutto 848,70 zł), jeśli zakupu dokonują osoby fizyczne prowadzące działalność gospodarczą lub osoby prawne;
  • obowiązującą dla płatności przed rozpoczęciem kursu.
Cena zawiera m.in. certyfikat zdania egzaminu (na podstawie rozwiązanych zadań sprawdzających), komplet materiałów z pełnymi rozwiązaniami, darmowe konsultacje, zajęcia w formie elearningowej (więcej).
(za 30 godzin dydaktycznych)
*Szczegóły cenowe
Text Mining i Web Scraping - Machine Learning

Poziom podstawowy + średnio zaawansowany

30 godzin dydaktycznych

Certyfikat ukończenia

Kursy e-learningowe LabMasters: informacja

Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl)

Oprogramowanie: R / R Studio

Miejsce: Platforma Moodle

Opis kursu

Przeznaczeniem kursu Analiza i wizualizacja danych w R, jest kompleksowe wprowadzenie Słuchaczy do pakietu R. Analitycy na całym świecie używają go do profesjonalnej analizy danych. Zajęcia dedykowane są przede wszystkim osobom rozpoczynającym przygodę z programem R i zaawansowaną analizą danych. Użytkownicy niepracujący wcześniej z danymi ilościowymi powinni (naszym zdaniem) najpierw dobrze poznać środowisko MS Excel. Z R komunikujemy się prawie wyłącznie przez pisanie komend (dostępnych w różnych pakietach). R posiada również interfejs graficzny, ale jest on tylko dodatkiem i ułatwieniem w programowaniu i obliczeniach. Na zajęciach uczymy się również używać gotowych komend oraz poznajemy podstawy programowania.

Zakres merytoryczny kursu Analiza i wizualizacja danych w R obejmuje zapoznanie słuchaczy ze środowiskiem R i R-Studio, przedstawienie podstawowych pakietów do efektywnej pracy w R, przetwarzania danych oraz wizualizacji graficznej. W programie kursu znajduje się również statystyka opisowa i elementy statystycznej analizy danych. Kurs ma charakter warsztatowy i jest intensywny. Podczas każdych zajęć oprócz prezentacji skryptów R, Słuchacze wykonują pod kierunkiem prowadzącego wiele krótkich ćwiczeń i zadań, które sprawiają, że wiedza przekazywana na zajęciach natychmiast zamienia się w konkretne umiejętności. Po kursie Słuchacz jest świadomym użytkownikiem programu R i potrafi samodzielnie poszerzać swoje kompetencje w wybranym przez siebie kierunku.

Zapisy

Rejestracja na kurs jest aktywna

Termin: brak sztywnych terminów – ciągły dostęp do kursu przez okres jednego roku
Miejsce: platforma e-learning MOODLE

Tematyka kursu

Wprowadzenie do środowiska R i R-Studio.

Podstawowe operacje na obiektach, przegląd obiektów w R, podstawowe komendy i funkcje, import/eksport danych, korzystanie z dokumentacji i funkcji pomocy, wyszukiwanie i ściąganie potrzebnych pakietów i informacji, omówienie środowiska R Studio, przydatne skróty klawiaturowe.

Praca na tabelach danych (pakiety dplyr, tidyr).

Wybieranie i zmiana nazw kolumn, filtrowanie wierszy, operator %in%, wybieranie unikalnych wartości, usuwanie duplikatów, sortowanie zbioru, czyszczenie danych, prosta imputacja wartości, obsługa braków danych, grupowanie i agregacja danych (tabele przestawne), przetwarzanie potokowe, transformacja tabel pomiędzy formą długą i szeroką, łączenie tabel danych po wspólnym kluczu, wykonywanie operacji w pętlach (instrukcje kończące się na _all, _if, _at), przedstawienie pętli do().

Pakiet ggplot2 (podstawy).

Zasady budowy wykresu, przegląd geometrii (funkcja geom), przegląd estetyk (funkcja aes()), tworzenie podstawowych wykresów (m. in. punktowy, słupkowy, liniowy), wizualizacja liniowego i nieliniowego trendu w danych, wizualizacja rozkładu statystycznego – histogram, wykres pudełkowy.

Pakiet ggplot2 (średnio zaawansowany).

Edycja wyglądu wykresu i jego elementów (funkcja themes()) oraz edycja skal i legendy (m. in. rodzina funkcji scale_*), wykorzystanie funkcji stat_* jako alternatywa i rozszerzenie funkcji geom_*, wykresy złożone w ggplot2, przegląd uzupełniających pakietów do ggplot2 (ggplot extentions).

Efektywna praca w R.

Budowanie powtarzalnych i zautomatyzowanych kodów oraz eksport wyników za pośrednictwem R Markdown (formaty: html, pdf, docx).

Czego się nauczysz

Na kursie Analiza i wizualizacja danych w R, nauczysz się programu R w stopniu średniozaawansowanym. Będziesz potrafił sprawnie i wygodnie wykonywać w R szczegółowe analizy zbiorów danych i komunikować wyniki za pośrednictwem przejrzystych tabel i ciekawych, atrakcyjnych graficznie wykresów i co ważniejsze, będziesz potrafił samodzielnie rozbudowywać swoje kompetencje w środowisku R, wyszukiwać potrzebne funkcje i pakiety w Internecie i aplikować je w swoich analizach.