Poziom podstawowy + średnio zaawansowany 30 godzin dydaktycznych Zajęcia zdalne lub stacjonarne w sali komputerowej Zaświadczenie ukończenia Ocena kursu: 4,51/5,00 – 97% ocen co najmniej 4 (w skali od 1 do 5) Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl) Oprogramowanie: R / R Studio Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa) |
Opis kursu
Przeznaczeniem kursu Analiza i wizualizacja danych w R, jest kompleksowe wprowadzenie Słuchaczy do pakietu R. Analitycy na całym świecie używają go do profesjonalnej analizy danych. Zajęcia dedykowane są przede wszystkim osobom rozpoczynającym przygodę z programem R i zaawansowaną analizą danych. Użytkownicy niepracujący wcześniej z danymi ilościowymi powinni (naszym zdaniem) najpierw dobrze poznać środowisko MS Excel. Z R komunikujemy się prawie wyłącznie przez pisanie komend (dostępnych w różnych pakietach). R posiada również interfejs graficzny, ale jest on tylko dodatkiem i ułatwieniem w programowaniu i obliczeniach. Na zajęciach uczymy się również używać gotowych komend oraz poznajemy podstawy programowania.
Zakres merytoryczny kursu Analiza i wizualizacja danych w R obejmuje zapoznanie słuchaczy ze środowiskiem R i R-Studio, przedstawienie podstawowych pakietów do efektywnej pracy w R, przetwarzania danych oraz wizualizacji graficznej. W programie kursu znajduje się również statystyka opisowa i elementy statystycznej analizy danych. Kurs ma charakter warsztatowy i jest intensywny. Podczas każdych zajęć oprócz prezentacji skryptów R, Słuchacze wykonują pod kierunkiem prowadzącego wiele krótkich ćwiczeń i zadań, które sprawiają, że wiedza przekazywana na zajęciach natychmiast zamienia się w konkretne umiejętności. Po kursie Słuchacz jest świadomym użytkownikiem programu R i potrafi samodzielnie poszerzać swoje kompetencje w wybranym przez siebie kierunku.
Zapisy
Zgłoś zainteresowanie
Jeżeli jesteś zainteresowany(a) wzięciem udziału w kursie realizowanym na żywo w innym terminie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji.
Tematyka kursu
Wprowadzenie do środowiska R i R-Studio.
Podstawowe operacje na obiektach, przegląd obiektów w R, podstawowe komendy i funkcje, import/eksport danych, korzystanie z dokumentacji i funkcji pomocy, wyszukiwanie i ściąganie potrzebnych pakietów i informacji, omówienie środowiska R Studio, przydatne skróty klawiaturowe.
Praca na tabelach danych (pakiety dplyr, tidyr).
Wybieranie i zmiana nazw kolumn, filtrowanie wierszy, operator %in%, wybieranie unikalnych wartości, usuwanie duplikatów, sortowanie zbioru, czyszczenie danych, prosta imputacja wartości, obsługa braków danych, grupowanie i agregacja danych (tabele przestawne), przetwarzanie potokowe, transformacja tabel pomiędzy formą długą i szeroką, łączenie tabel danych po wspólnym kluczu, wykonywanie operacji w pętlach (instrukcje kończące się na _all, _if, _at), przedstawienie pętli do().
Pakiet ggplot2 (podstawy).
Zasady budowy wykresu, przegląd geometrii (funkcja geom), przegląd estetyk (funkcja aes()), tworzenie podstawowych wykresów (m. in. punktowy, słupkowy, liniowy), wizualizacja liniowego i nieliniowego trendu w danych, wizualizacja rozkładu statystycznego – histogram, wykres pudełkowy.
Pakiet ggplot2 (średnio zaawansowany).
Edycja wyglądu wykresu i jego elementów (funkcja themes()) oraz edycja skal i legendy (m. in. rodzina funkcji scale_*), wykorzystanie funkcji stat_* jako alternatywa i rozszerzenie funkcji geom_*, wykresy złożone w ggplot2, przegląd uzupełniających pakietów do ggplot2 (ggplot extentions).
Efektywna praca w R.
Budowanie powtarzalnych i zautomatyzowanych kodów oraz eksport wyników za pośrednictwem R Markdown (formaty: html, pdf, docx).
Czego się nauczysz
Na kursie Analiza i wizualizacja danych w R, nauczysz się programu R w stopniu średniozaawansowanym. Będziesz potrafił sprawnie i wygodnie wykonywać w R szczegółowe analizy zbiorów danych i komunikować wyniki za pośrednictwem przejrzystych tabel i ciekawych, atrakcyjnych graficznie wykresów i co ważniejsze, będziesz potrafił samodzielnie rozbudowywać swoje kompetencje w środowisku R, wyszukiwać potrzebne funkcje i pakiety w Internecie i aplikować je w swoich analizach.