Nível:
Graduação
Nome da disciplina:
Linguagem R
Número de Créditos:
5
Oferecimento:
1º Período Letivo
Pré-requisito:
(não há)
Ementa:
Introdução à linguagem de programação e ao uso do software R. Objetos e estruturas de dados (vetores, listas, fatores, matrizes, data frame e arrays). Indexação de objetos e subconjuntos. Operações com diferentes tipos de variáveis (inteiros, reais, caracteres, fatores e data/hora). Estruturas de controle de fluxo. Criação e uso de funções. Introdução à vetorização. Importação e exportação de dados. Limpeza, preparação e manipulação de dados. Visualização de Dados. Estratégias para debugging. Introdução à programação paralela.
Conteúdo / Programa:
1. Introdução
1.1 Sobre a linguagem R
1.2 Como instalar o R e RStudio
1.3 Console e ambiente de trabalho
1.4 Ajuda no R
1.5 Pacotes/bibliotecas
1.6 Tipos de dados: caracteres, inteiro, numérico, lógico e complexo
1.7 Estruturas de dados: vetores, matrizes, fatores, arrays, listas, data frames
1.8 Variáveis locais e globais
2. Programação Básica
2.1 Indexar vetores e matrizes
2.2 Operadores lógicos
2.3 Controle de fluxo: if/else; ifelse
2.4 Blocos de repetição: for; while
2.5 Vetorização e funcionais: família apply e replicate
2.6 Funções: definir e executar
2.7 Salvar e executar seu código usando um RScript
2.8 Introdução ao RMarkdown
3. Importação e Exportação de Dados
3.1 Diretório de trabalho e localização de arquivos
3.2 Dados tabulares e seus formatos (csv, tsv, xls, SAS, SPSS)
3.3 Importar e exportar dados tabulares na base do R
3.4 Importar e exportar dados tabulares com o pacote readr
3.5 Importar e exportar dados de Excel
3.6 Importar dados a partir de uma URL
4. Preparação e Manipulação de Dados
4.1 Dados no formato tidy
4.2 Limpeza e formatação de dados usando o pacote tidyr
4.3 Manipulação de dados com dplyr e seus verbos
4.4 Subconjuntos, filtros e criação de novas colunas
4.5 Strings e expressões regulares
4.6 Trabalhando com data e hora
4.7 Resumindo dados
5. Visualização de Dados
5.1 Introdução à visualização de dados
5.2 Gráficos na base do R: histograma, boxplot, gráfico de dispersão
5.3 Gráficos com ggplot2
5.4 Princípios na criação de gráficos
6. Estratégias para Debugging
7. Introdução à Programação paralela: SOCK, MPI, multicore
Forma de Avaliação:
Por nota e frequência
Referência Bibliográfica:
Chambers, J. (2008). Software for Data Analysis: Programming with R. Springer.
Irizarry, R (2019). Introduction to Data Science. Chapman and Hall/CRC, 1st edition.
Peng, R.D. (2015). R Programming for Data Science. Leanpub.
Wickham, H. and Grolemund, G. (2017). R for Data Science. O’Reilly.
Wickham, H. (2016). ggplot2 Elegant Graphics for Data Analysis. Springer, 2nd edition.