Pokročilé zpracování biologických dat

Stanislav Pekár (vyučující předmětu) ve spolupráci s externím spolupracovníkem Markem Brabcem.

Kurz navazující na zavedený předmět Zpracování biologických dat, zaměřený na výuku pokročilých statistických metod (Generalised Least Squares, Linear Mixed Effects Model, Generalised Estimating Equations a dalších) s řešením konkrétních biologických příkladů, se uskutečnil blokovou formou v průběhu dubna 2011.

V monitorovaném období před konáním kurzu proběhla příprava výuky:
- studium odborné literatury (vedle níže uvedeného titulu též Cowpertwait et Metcalfe, 2009: Introductory Time Series with R, a Zuur et al., 2008: Mixed effect models and extensions in ecology with R);
- praktická příprava k dílčím tématům (typy designů, definice modelů, korelační a kovarianční matice, BLUPy a predikce).

jarní semestr 2011, výuka realizována v době 7.-26. 4.

Obsah výuky:
7. 4. (čtvrtek): Úvod do problematiky korelovaných dat, experimentální typy designů, definice replikace a pseudoreplikace, literatura
8. 4. (pátek): Metody odhadů koeficientů pevných a náhodých efektů, rozvoj zobecněného lineárního modelu
12. 4. (úterý): Linear Mixed Effect Models, definice modelu s náhodnými a smíšenými efekty, charakteristiky chyb, diagnostika předpokladů, kovarianční struktury
13. 4. (středa): Analýza časových řad, prostorová analýza
19. 4. (úterý): Generalised Least Squares a Generalized Estimating Equations, definice modelů s pevnými efekty, charakteristiky chyb, diagnostika předpokladů, korelační struktury
26. 4. (úterý): Fylogenetické korekce

Náplní výuky je vysvětlení práce s konkrétními daty pomocí vhodných metod a jejich praktické procvičení. Příprava na výuku spočívá v rozvržení konkrétních metod do souvisejících celků pro jednotlivé lekce a namyšlení modelových příkladů, ale jádrem výuky je pak výklad a praktické ukázky možností statistického hodnocení různých dat, která studenti získávají při zpracování svých bakalářských nebo diplomových prací. Výuka je v tomto případě interaktivní a průběh jednotlivých lekcí je zaměřen na řešení konkrétní problematiky, kterou musí frekventanti kurzu řešit v rámci svého studia.
Na rozdíl od klasické přednášky nebo cvičení s předem "nalinkovaným" programem tak lze pro tento předmět těžko připravit kompaktní studijní materiál, ale z pohledu vyučujících je potřebná rozsáhlá teoretická příprava, aby byli schopni pružně reagovat na konkrétní dotazy a předložit studentům ideální způsob zpracování konkrétních dat, která se mohou případ od případu lišit.

jarní semestr 2012, výuka realizována v době 18.-20. 4.

V období jara 2012 proběhla aktualizace výuky s využitím odborné literatury - v úvodu roku Regression modelling strategies (Harrell, 2001), v závěru jarního semestru pak Survival analysis using S (Tableman et Kim, 2004).

Vlastní výuka předmětu se uskutečnila blokovou formou (tři celodenní bloky) v průběhu dubna 2011. Náplň cvičení byla obdobná jako v předchozím roce.
Podle zájmu studentů bude v následujících letech vyučován s roční nebo dvouletou periodicitou.

Základní studijní literaturou pro tento předmět je Moderní analýza biologických dat; k prvnímu dílu, vydanému před třemi lety, zpracovali Pekár a Brabec pokračování (Moderní analýza biologických dat 2), zaměřené na metody statistické analýzy korelovaných dat. Na příkladech řešení konkrétních modelových situací tato kniha poskytuje ideální vodítko pro praktickou analýzu dat z různých biologických oborů. Tiskové vydání této knihy bylo financováno z jiného zdroje.

Předměty