Úvod do R

Vít Syrovátka

Úvod do R je nový předmět aktuálně zařazený do výuky vzhledem k současnému rychlému rozšíření programu R. Jde o software používaný pro statistické a grafické zpracování datových souborů, který je na rozdíl od komerčních statistických programů volně k dipozici jako open-source a představuje tak ideální nástroj pro studenty, dostupný bez obvyklé nutnosti nákupu multilicence. Předmět je zařazen v magisterském stupni výuky (primárně pro magisterské studenty zoologie), ale mohou jej stejně tak využít i studenti bakalářského stupně anebo jiných oborů, pro které R představuje optimální nástroj pro zpracování jejich dat.
Náplní výuky je základní práce s daty v softwaru R pro praktickou aplikaci statistických metod vyučovaných v navazujících předmětech. Jde o kombinovanou přednášku s praktickým cvičením na počítačích.

podzimní semestr 2010, výuka realizována v průběhu semestru 20. 9.-22. 12.

Výuka nového předmětu, realizovaná v podzimním semestru 2010, pokrývá následující problematiku:
instalace R a balíků, nápověda, literatura,
typy objektů v R, tvorba vektorů, využití sekvencí a repeticí;
výpočty na vektorech, základní vestavěné vektorové funkce, aritmetické operátory;
tvorba objektů typu matrix, array, dataframe a list;
výpočty na maticích a dataframech, násobení matic;
využití subscriptů;
řazení členů objektů pomocí funkcí sort(), rank() a order();
smyčky v R - tvorba cyklických příkazů;
spojování dataframů pomocí smyček a příkazů match() a merge();
import dat do R, ukládání výpočtů provedených v R, jejich export a úprava v Excelu;
převedení numerického vektoru na faktor a jeho následné využití;
jak fungují funkce, jak R zpracovává argumenty;
tvorba vlastních funkcí;
aplikace funkcí pomocí příkazů apply(), tapply(), sapply() a lapply().
V období od začátku roku do podzimu 2011 byl (s využitím pořízené literatury a elektronických informačních zdrojů) inovován materiál pro výuku v následujících oblastech:
prostředí programu R;
instalace, nastavení a využití editoru kódu Tinn-R;
instalace R knihoven, jejich aktualizace a práce s nimi;
objekty v R - vektory, matice, arrays, dataframy, list;
indexování objektů, logické subskripty, příklady práce s různými objekty;
aritmetické operace;
načtení vlastních dat do R, ukládání objektů a pracovního prostředí, export výsledků;
získání informací o objektech - str() a summary() funkce;
kombinování objektů se společným identifikátorem;
sumarizace počtů uvnitř úrovní faktorů pomocí funkce table();
řazení objektů - funkce sort(), order(), rank().
generování sekvencí;
tvorba faktorů pomocí funkcí gl() a cut();
použití funkce expand.grid();
tvorba faktorů z kontinuálních proměnných;
generování náhodných čísel různého rozložení;
permutace;
speciální funkce pro matice;
agregování dat pomocí funkcí aggregate() a ftable();
generování repeticí;
získání informací o objektech - str(), summary;
struktura výpočetních výsledků analýz;
dosáhnutí na jednotlivé části výsledku analýz;
zjištění shodných členů pomocí match() a intersect().

podzimní semestr 2011, výuka realizována v průběhu semestru 19. 9.-22. 12.

V inovované podobě s doplněnou náplní výuky byl předmět realizován v podzimním semestru tohoto roku.
Vytvořené výukové materiály jsou studentům k dispozici v informačním systému MU.

I nadále probíhá postupné doplňování náplně výuky s využitím pořízené literatury a elektronických informačních zdrojů. V roce 2012 byl doplněn či inovován materiál pro výuku v následujících oblastech:
kombinování objektů se společným identifikátorem;
použití balíku reshape, funkce melt() a cast().
Příprava příkladů k procvičování:
tvorba objektů v R - vektory, matice, dataframy, list, faktor;
přejmenování a seřazení úrovní faktoru;
matematické operace na vektorech a dataframech;
transformace proměnných (vektorů).

podzimní semestr 2012, výuka realizována v průběhu semestru 17. 9.-21. 12.

I nadále probíhá postupné doplňování náplně výuky; v tomto období to byla v první řadě příprava dalších příkladů k procvičování, rovnou využitých v aktuálním semestru:
standardizace proměnných (vektorů);
standardizace dataframů;
zjišťování informací o objektech;
změna třídy objektů;
logické výrazy;
tvorba logických vektorů;
logické indexování pomocí logických vektorů;
numerické indexování (subscripty);
jmenné indexování (subscripty);
indexování dvourozměrných objektů;
podvýběry pomocí funkce subset();
indexování objektů typu list;
tvorbu nových proměnných v dataframech.
Další příklady k procvičování připravené v průběhu roku 2013:
tvorba sekvencí;
tvorba repeticí;
import dat pomocí funkce paste() a funkcí z rodiny read.table();
export dat a výsledků pomocí funkce write.table();
řazení hodnot v objektech - funkce sort(), rank() a order().

podzimní semestr 2013, výuka realizována v průběhu semestru 16. 9.-20. 12.

I nadále probíhá postupné doplňování náplně výuky - příprava příkladů k procvičování:
tvorba faktorů z vektorů;
generování vlastních faktorů;
změna faktorů - přejmenování úrovní, seřazení úrovní, sloučení úrovní, zjištění jedinečných a společných hodnot dvou datových souborů, spojení dvou datových souborů, tvorba vlastních funkcí;
opakovaná aplikace funkcí pomocí smyček.

Fotogalerie předmětu

Předměty