Studijní materiály
Domácí úkoly zpracujte v Rmd
(Markdown), nebo qmd
(quarto) formátu, odevzdejte ve ZKOMPILOVANÉ verzi, tj. výstup do html/pdf/docx
souboru.
echo=T
(je defaultní).Obecná doporučení pro práci s R (domácí úkoly)
Je-li to nutné, nainstalujte si poslední verzi Pandoc (Rmd
compiler)
install.packages(“installr”,dependencies = T)
installr::install.pandoc() # may require admin access rights
Vypracujte zadání ve skriptu R03_data_handling_exercise.Rmd
.
Zkompilovaný html/pdf/docx soubor odevzdejte prostřednictvím odevzdávárny v insisu.
dplyr
a pipe operátoru: filtrování “vhodných” ukazatelů podle Vašeho uvážení. Popište, jaká data jste vybrali (případně proč).ggplot2
. Před vizualizací dat ověřte rozměr výsledného datasetu pomocí příkazu dim()
. Při správném filtrování musí počet řádků datasetu odpovídat zobrazovaným datům. (Např: zobrazuji řady s HDP pro 10 regionů a 5 let -> data frame má 50 řádků v tzv. dlouhém formátu.)zoo
).R07_Eurostat.Rmd
(ale nepoužívejte přímo datasety z tohoto skriptu).Bonusový úkol, 2 body navíc: Na datasetu vhodným způsobem ukažte imputaci chybějících dat na jednorozměrné ČŘ, například pomocí balíčku imputeTS
(v případě potřeby NAs sami vytvořte).
Vizualizace prostorových dat v R - kartogram (infomapa)
K vizualizaci použijte dva různé datasety: jeden může vycházet z úkolu pro minulý týden, druhý dataset si opět zvolte/vyhledejte na Eurostatu (nebo použijte jiný vhodný zdroj dat).
Pro Vámi vybrané proměnné zobrazte infomapu, např. podle vzoru ze skriptu R02_ggplot_choropleths.R
ggplot()
zkontrolujte rozměr datasetu.Testování prostorové (ne)závislosti v R
Pro tento úkol lze použít data (tj. regiony), která jste stáhli v rámci úkolu z minulého týdne - pokud má výběr alespoň 50 pozorování. V opačném případě (malý výbět) najděte jiný dataset (ideálně na úrovni NUTS2 nebo NUTS3), abyste měli dostatek pozorování pro provedení testu.
Zvolte jednu proměnnou (a jedno období pozorování - ideálně co nejblíže roku 2024) a proveďte Moranův test na prostorovou nezávislost.
Použijte alespoň dva různé způsoby definice prostorové struktury (vzdálenost, vzdálenost + kNN, společná hranice) k ověření robustnosti výsledků vůči změnám prostorové struktury.
Slovně okomentujte výsledky (interpretujte výsedek testu).
Shluková analýza na prostorových datech v R
Pro tento úkol lze použít data (tj. regiony), která jste stáhli v rámci úkolu z minulého týdne - pokud má výběr alespoň 50 pozorování a pokud data vykazují pozitivní prostorovou závislost. V opačném případě najděte jiný dataset (ideálně na úrovni NUTS2 nebo NUTS3), abyste měli dostatek pozorování pro provedení testu.
Zvolte jednu proměnnou (a jedno období pozorování - ideálně co nejblíže roku 2024) a proveďte shlukovou analýzu - jako vodítko můžete použít skript R09_LISA_and_clusters.R
z bloku 2.
Použijte alespoň dva různé způsoby definice prostorové struktury (vzdálenost, vzdálenost + kNN, společná hranice) k ověření robustnosti výsledků vůči změnám prostorové struktury.
Slovně okomentujte výsledky.
R03_Model_selection.R
Zpracujte rozšířený abstrakt své seminární práce - popište vybrané téma (motivace, výzkumný záměr), popište data, popište preferovanou odhadovou metodu. Jaký je Váš konkrétní cíl? Jaké vidíte potenciální problémy či komplikace? Případně uveďte zpracovaný model a/nebo dílčí výstupy odhadu. Rozsah 1-2 strany A4 (cca 400-800 slov).
Zpracujte úkol podle zadání ve skriptu R16_GAM_diamonds_example.R
z Bloku 3.
R06_LME_wagepanel_hierarchical_data.R
.R02_LPM_Logit_Probit.R
(Quick exerice, začínající na ř. 257),