Blocos de conteúdo principal
Contorno da seção
-
-
Na ementa resumida é possível verificar os projetos / temas propostos a partir da terceira semana do curso.
-
Esse é o link de reprodução das aulas gravadas até o momento, que incluirá em tempo, as futuras.
-
Tópicos cobertos nas aulas da semana:
1) Qual é o fluxo de trabalho do trabalho com dados dentro do trabalho científico?;2) O trabalho sério e crítico com dados para avanço científico;3) Manual x máquina -> qual parte importa/o que deixar para a máquina;4) Noções de Algoritmos;5) O script como uma receita
-
Tópicos cobertos nas aulas da semana:
A modularidade do R e os "pacotes"/ "bibliotecas"
-
Objetivos da semana serão reproduzir um fluxo completo de trabalho: importação, limpeza, exploração e processamento, formatação e exportação de dados.
Nessa semana, os objetivos de conhecimento dentro do ambiente RStudio serão conhecer:
- objetos - tabelas (data.frame) e listas (list)
- visualização de propriedades dos objetos - str e class
- filtragem(subset)
- plotagem simples
O objetivo da semana será importar arquivos csv com dados de trabalho intermitente e parcial, criar objetos no R a partir desses arquivos, fazer filtragens básicas, e produzir um gráfico -
Objetivos da semana – importar e processar dados de xls, modificar leiaute dos mesmos, calcular novas colunas/variáveis, exportar tabela formatada em csv.
Elementos a conhecer do R:
importar planilhas
visualizando objetos - summary
pacote dplyr – junção e reformatação (rbind, cbind, bind_rows)
criação de tabelas formatadas
Exportação para csv e xls
- Lista de pacotes adicionais da semana
-
Grupo 1 de tutoria Chat
-
Objetivos da semana – acesso básico a dados do censo suas – estimar indicadores municipais vinculados às populações locais
A conhecer no RStudio:
download.file e unzip
utilizar pacotes não disponíveis no CRAN, ou com versões mais atualizadas fora do mesmo
scripts – microdadospoliticasocialbrasil voltados ao CensoSUAS
pivot_longer / pivot wider
plotagem com ggplot
aprofundamento a funções
- Pacotes adicionais a utilizar - haven e readODS
-
Link estático para o Vídeo
https://l.borges.net.br/introRcompind
Exemplo de indicador completo a partir de dados base de CAGED e do IBGE, com mostras de manipulação de tabelas , criação de função, laço e plotagem.
-
Vídeo mostrando a manipulação e combinação de dados CAGED com dados populacionais para estimar indicador microrregional de desemprego. Nesta página, foram embutidos tanto o vídeo como os slides.
-
Alguns exercícios sobre o conteúdo de tipos de tabelas e funções utilizadas recentemente para manter a prática em dia e consolidar o conhecimento.
-
Fluxo completo com dados retirados do portal da transparência
A conhecer/praticar no R:
laços ou loops (lapply, sapply, apply, for)
pacote portransp
- introdução a controle de fluxo (laços if, for, while)
Estatística aplicada - exemplo de correlação
- Estatística aplicada - exemplo de tratamento de outliers
- Gráficos para regressão - pacote ggpubqr
-
Fluxo de trabalho completo com dados da PNADc, com foco nas informações de trabalhadores informais
A conhecer no R
pacote survey
pacote PNADcIBGE
complemento: interface de fórmula no R
-
Fluxo completo de trabalho com dados do datasus
A conhecer no R:
pacote datasus (dados populacionais e de saúde)
pacotes de informação econômica complementar (sidrar e ipeadata)
função source
introdução a funções de predição simples (predict)
-
Fluxo de trabalho completo com dados da Pesquisa de Orçamentos Familiares, com foco em reclassificar famílias de acordo com critérios de classe social, ao invés de faixa de renda, comparando POF 2008-2009 e POF 2017-2018
A conhecer no R:
importando microdados de maneira direta, sem pacotes
scripts pofesferas
compatibilizando diferentes agregações – da POF para os setores do SCN
extrapolações simples da cesta de consumo para o Consumo das Famílias nas Contas Nacionais
-
Fluxo completo de trabalho com dados do CadÚnico (foco em BPC, Bolsa Família e primeira infância)
A conhecer no R:
aproveitando exemplos compartilhados - scripts cadunico (JACOB, G.)
scripts microdadospoliticasocial (indicadores) relativos ao cadunico
introdução ao trabalho com dados amostras complexos – pacote survey
-
Fluxo completo com dados de Censo Escolar ou Censo da Educação Superior
A conhecer no R:
Pacote microdadosbrasil
funções de sumarização – (ex. aggregate , colsums, rowsums)
introdução a mapeamento
-
Para esta semana, deve-se clonar o seguinte repositório:
https://gitlab.com/rodrigoesborges/bepermunicipal.git
O script inicial de trabalho é "importa_cadunico.R" (dentro da pasta R do projeto)
Este script baixa os dados e importa para o R em formato trabalhável mesmo diante da quantidade de dados.