Studijní materiály
Domácí úkoly zpracujte v Rmd
(Markdown), nebo qmd
(quarto) formátu,
odevzdejte ve ZKOMPILOVANÉ verzi, tj. výstup do html/pdf/docx
souboru.
echo=T
(je defaultní).Obecná doporučení pro práci s R (domácí úkoly)
Je-li to nutné, nainstalujte si poslední verzi Pandoc (Rmd
compiler)
install.packages(“installr”,dependencies = T)
installr::install.pandoc() # may require admin access rights
Vypracujte zadání ve skriptu R03_data_handling_exercise.Rmd
.
Zkompilovaný html/pdf/docx soubor odevzdejte prostřednictvím odevzdávárny v insisu.
Bonusový úkol (2b): Quick exercise: 3 ze skriptu R06_dplyr.Rmd
(poslední příklad ze skriptu)
dplyr
a pipe operátoru: filtrování “vhodných” ukazatelů podle Vašeho uvážení. Popište, jaká data jste vybrali (případně proč).ggplot2
. Před vizualizací dat ověřte rozměr výsledného datasetu pomocí příkazu dim()
. Při správném filtrování musí počet řádků datasetu odpovídat zobrazovaným datům. (Např: zobrazuji řady s HDP pro 10 regionů a 5 let -> data frame má 50 řádků v tzv. dlouhém formátu.)zoo
).R07_Eurostat.Rmd
(ale nepoužívejte přímo datasety z tohoto skriptu).Vypracujte Assignment 1 (na ř. 275 skriptu R11_Missing_data.R
)
Vizualizace prostorových dat v R - kartogram (infomapa)
K vizualizaci použijte dva různé datasety: jeden může vycházet z úkolu pro minulý týden, druhý dataset si opět zvolte/vyhledejte na Eurostatu (nebo použijte jiný vhodný zdroj dat).
Pro Vámi vybrané proměnné zobrazte infomapu, např. podle vzoru ze skriptu R02_ggplot_choropleths.R
ggplot()
zkontrolujte rozměr datasetu.Interpolace prostorových dat
R06b_Complex_spatial_interpolation_example.Rmd
a odevzdejte ve zkompilovaném formátu (html/docx/pdf).Testování prostorové (ne)závislosti a shluková analýza
Pro tento úkol lze použít data (tj. regiony), která jste stáhli v rámci úkolu v předchozích týdnech, pokud má výběr alespoň 50 pozorování. V opačném případě (malý výbět) najděte jiný dataset (ideálně na úrovni NUTS2 nebo NUTS3), abyste měli dostatek pozorování pro analýzu.
Zvolte jednu proměnnou (a jedno období pozorování - co nejblíže roku 2024 - a proveďte Moranův test na prostorovou nezávislost.
Použijte alespoň dva různé způsoby definice prostorové struktury (vzdálenost, vzdálenost + kNN, společná hranice) k ověření robustnosti výsledků vůči změnám prostorové struktury.
Proveďte shlukovou analýzu (alespoň jeden typ výstupu) - jako vodítko můžete použít skript R09_LISA_and_clusters.R
z bloku 2.
Slovně okomentujte výsledky (interpretujte výsledek testu).
Zpracujte rozšířený abstrakt své seminární práce - popište vybrané téma (motivace, výzkumný záměr), popište data, popište preferovanou odhadovou metodu. Jaký je Váš konkrétní cíl? Jaké vidíte potenciální problémy či komplikace? Případně uveďte zpracovaný model a/nebo dílčí výstupy odhadu. Rozsah 1-2 strany A4 (cca 400-800 slov).
Stepwise a penalizovaná regrese
Upozornění: zapomněl jsem úkol z týdne 9 zadat včas do insisu a na web kurzu. Termín odevzdání je proto posunut do pátku 22.11., abyste měli čas na vypracování. Děkuji za pochopení.
Proveďte stepwise regresi, použijte alespoň dvě varianty výběru (best subset, forward, backwards)
Proveďte tzv. penalizovanou regresi (alespoň jednu z variant: ridge, LASSO, elastic net).
Zpracujte úkol podle zadání ve skriptu R16_GAM_diamonds_example.R
z Bloku 3 (odevzdejte ve zkompilované markdown podobě (pdf, html, Word).