Poziom podstawowy + średnio zaawansowany 30 godzin dydaktycznych Zajęcia zdalne lub stacjonarne w sali komputerowej Zaświadczenie ukończenia Ocena kursu: 4,61/5,00 – 100% ocen co najmniej 4 (w skali od 1 do 5) Koordynator: Piotr Ćwiakowski (pcwiakowski@labmasters.pl) Oprogramowanie: R / R Studio Miejsce: Wydział Nauk Ekonomicznych UW, Warszawa ul. Długa 44/50 (mapa) |
Opis kursu
Kurs Podstawy statystyki matematycznej w R powstał jako rezultat analizy i lektury podręczników ze statystyki matematycznej dostępnych na polskim rynku. Dlaczego tak trudno jest opowiedzieć o statystyce w sposób ciekawy, prosty i intuicyjny? Dlaczego niektóre fundamentalne kwestie są przemilczane w większości książek i trzeba się ich samemu domyślać? Jeśli interesuje Cię jak dobrze skonstruować i wykonać badanie statystyczne oraz chcesz poznać statystykę matematyczną od podstaw lub po prostu uporządkować i rozszerzyć swoją dotychczasową wiedzę – jest to kurs dla Ciebie.
Oprócz solidnego i szczegółowego wyjaśnienia sensu badań i modeli statystycznych, oferujemy szeroki przegląd podstawowych testów statystycznych – testu Z, T-Studenta, testów nieparametrycznych, analizy korelacji oraz badania zależności w tablicy wielodzielniczej (kontyngencji). Wcześniejsza znajomość programu R nie jest wymagana. Wprowadzenie do R jest na tym kursie skrócone i dotyczy jedynie zagadnień niezbędnych do samodzielnej pracy w R. Oczywiście wszystkie kody i komendy wprowadzane na późniejszych lekcjach są starannie i wyczerpująco objaśnione w materiałach i w trakcie zajęć. Dzięki temu osoby ze słabszą wiedzą o programie R również sobie na tym kursie radzą. Tym samym na koniec kursu Słuchacz jednocześnie nabywa wiedzę o programie R i umie w nim wykonywać statystyczną analizę danych.
Zapisy
Zgłoś zainteresowanie
Jeżeli jesteś zainteresowany(a) wzięciem udziału w kursie realizowanym na żywo w innym terminie, zgłoś wstępną chęć uczestnictwa. Dzięki temu, wcześniej niż inni otrzymasz informację o zapisach i będziesz mieć pierwszeństwo w rejestracji.
Tematyka kursu
Statystyka opisowa.
Wprowadzenie do statystyki, typy danych w analizie statystycznej, rozkład empiryczny zmiennej, techniki opisywania rozkładu (miary tendencji centralnej, miary rozproszenia), wizualizacja rozkładu empirycznego: histogram, wykres pudełkowy, wykres słupkowy, wykres gęstości (empirycznej i teoretycznej), wykres skrzypcowy, wykres kwantylowy (quantile-quantile plot).
Elementy rachunku prawdopodobieństwa.
Dystrybuanta i funkcja gęstości, Prawo Wielkich Liczb, Centralne Twierdzenie Graniczne, przegląd wybranych rozkładów zmiennej ciągłej i dyskretnej.
Budowa testu statystycznego.
Błąd standardowy (pojęcie i oszacowanie), konstruowanie hipotez statystycznych, omówienie błędów I i II rodzaju, określanie i znaczenie poziomu istotności, konstrukcja statystyki testowej, weryfikacja i interpretacja wyniku testu statystycznego, przedział ufności – budowa i interpretacja, badanie mocy testu, określanie wielkości próby do badania.
Przegląd testów parametrycznych.
Test T Studenta w jednej i dwóch próbach, testy homogeniczności wariancji w dwóch próbach, testy odsetka, różnica między testem Z i T, omówienie założeń testów parametrycznych i konsekwencji ich nie spełnienia.
Badanie normalności rozkładu.
Znaczenie założenia o normalności rozkładu, testowanie hipotezy o normalności rozkładu (przegląd testów, m. in. test Kołmogorowa-Smirnowa, Shapiro-Wilka, Juarqe-Bera).
Przegląd testów nieparametrycznych.
Omówienie słabości testów nieparametrycznych, przegląd testów (omówienie sposobów liczenia): Test znaków, test Manna-Witneya, test Wilcoxona.
Analiza korelacji.
Liczenie, testowanie, interpretacja, współczynnika korelacji (Pearsona, Spearmana, Tau Kendalla), różnica między korelacją i przyczynowością, wizualizacja macierzy korelacji (korelogram).
Analiza tablicy kontyngencji.
Test zgodności i niezależności chi-kwadrat, poprawka Yatesa, Test Fishera, statystyka V-Cramera, współczynnik Phi, wizualizacja tablicy kontyngencji (np. wykres mozaikowy, balloon plot).
Wstęp do regresji liniowej.
Teoria budowy modelu regresji liniowej, algorytm wyznaczania parametrów, regresja z jedną zmienną, regresja wielu zmiennych, oszacowanie i interpretacja wyników.
Czego się nauczysz
Dzięki temu kursowi Podstawy statystyki matematycznej w R, pozyskasz umiejętność biegłego posługiwania się pakietem R w zakresie statystycznej analizy danych. Poznasz procedurę wnioskowania statystycznego i będziesz potrafił intuicyjnie i świadomie interpretować jego wyniki. Nauczysz się dobierać odpowiedni test statystyczny do badanego problemu i typu analizowanych danych. Poznasz różnice, mocne oraz słabe strony testów parametrycznych oraz nieparametrycznych. Będziesz potrafić zastosować w praktyce współczynnik korelacji, analizę tabeli kontyngencji i model regresji liniowej (z jedną i wieloma zmiennymi).