-
Materiały: github, moodle
-
Zaliczenie: projekt przez Kaggle
-
Shiny:
-
Zaliczenie:
- szablon w quarto: plik.qmd, wygląd raportu
- szablon w jupyter notebook (colab)
- przydatne procedury:
- R:
rnorm,plogis,density, ... - Python:
np.random...,gaussian_kde, ...
- R:
- kody do generowania braków danych
- R:
NA,NA_integer_,NA_character_,is.na,Inf,NaN - Python:
np.nan,pd.np.nan,pd.NA,pd.NaT,is.null - kody na zajecia
- Zbiory danych na potrzeby zajęć:
csvsav-- Bilans Kapitału Ludzkiego -- zbiór, kwestionariusz
- narzędzia:
- R:
VIM,naniar,panelView - Python:
missingno,upsetty
- R:
- Kody generujące przykłady: R, Python
- Zbiory danych na zajęcia: dane przekrojowe, dane panelowe (long), dane panelowe (wide)
- Zbiór danych na ćwiczenia data2-zajecia-przyklad1.csv
- Notatnik na zajęcia: Wizualizacja braków danych
-
Imputacja dedukcyjna:
- R:
zoo::na.locf,tidyr::fill,data.table::nafill,deducorrect - Python:
fillnazpandas - Zbiór danych na ćwiczenia data3-zajecia-przyklad1.csv
- Notatnik
- R:
-
Imputacja metodą najbliższego sąsiada:
- R:
simputation,VIM - Python:
KNNImputerzsklearn.impute - Zbiór danych na ćwiczenia data4-czytelnictwo.csv
- Notatnik
- R:
-
Imputacja metodą predykcyjnego dopasowania średnich (ang. predictive mean matching)
- R:
simputation,FNN - Python:
sklearn.linear_model,sklearn.neighbors - Zbiór danych na ćwiczenia data4-czytelnictwo.csv
- Notatnik
- R:
-
Imputacja wielokrotna
-
Imputacja regresyjna
-
Wstęp do kalibracji
- R:
survey,sampling,laeken - Python:
samplics - Notatnik
- Dane na zajęcia data5-kalibracja.csv
- R:
-
Kalibracja (bardziej zaawansowana)
- R:
survey - Python:
samplics - Notatnik
- Dane na zajęcia gospodarstwa-zajecia.xlsx
- R:
- PSW
- R:
stats,glmnet - Python: TBA
- Notatnik
- Dane na zajęcia gospodarstwa-zajecia.xlsx
- R:
- R:
boot - Python: TBA
- Notatnik
- Dane na zajęcia gospodarstwa-zajecia.xlsx