Vídeos

R para ciência de dados: um curso introdutório

Parte 2 de 2

  • Walmes Zeviani
  • Servidores dos tribunais de justiça com formação em Estatística
  • III Workshop de Estatística do Poder Judiciário · Conselho Nacional de Justiça
  • Tribunal Superior Eleitoral, Setor de Administração Federal Sul, Quadra 7, Lotes 1/2, Auditório 1, subsolo – Brasília/DF
  • 02 de Agosto de 2019
  • 2h11

Nessa parte do curso é feito um apanhado de recursos interessantes sobre a linguagem R como os ferramental para manipulação e visualização de dados, construção de disponibilização de dashboards com Shiny e desenvolvimento de relatórios dinâmicos com Rmarkdown. São indicados livros para aprendizado de R para usuários iniciantes, intermediários e avançados. Perguntas da platéia são respondidas de tempos em tempos durante a apresentação.


R para ciência de dados: um curso introdutório

Parte 1 de 2

  • Walmes Zeviani
  • Servidores dos tribunais de justiça com formação em Estatística
  • III Workshop de Estatística do Poder Judiciário · Conselho Nacional de Justiça
  • Tribunal Superior Eleitoral, Setor de Administração Federal Sul, Quadra 7, Lotes 1/2, Auditório 1, subsolo – Brasília/DF
  • 01 de Agosto de 2019
  • 2h00

Nessa parte do curso é feita introdução à linguagem R, com motivação e algumas passagens históricas, é dado o básico da linguagem, com tipos de objetos, atribuição, seleção, estrutura de controle, funções. São feitos comentários sobre editores disponíveis para R.


Importância, tendências e competências em visualização de dados

Nessa rápida conferência é enfatisado a importância da visualização de dados no atual momento da ciência de dados, as principais tendências do campo e as competências consideradas determinantes para uma equipe envolvida em data storytelling. Rapidamente são discutidos alguns aspectos chaves de fundamentos de visualização de dados e recursos de software.


Visualização de dados

História e fundamentos

A visualização de dados permite rápida extração de insights para problemas baseados em dados. O conhecimento dos princípios de visualização gráfica e o domínio de recursos computacionais para elaboração ágil, interativa e reproduzível são fundamentais para obter visualizações que comuniquem valor de forma descomplicada em todos os aspectos: elaboração, exame, interpretação e ação. Nessa aula define-se o que é visualização de dados, discorre-se sobre aspectos históricos, tipos de visualização, variáveis visuais e as principais competências relacionadas a visualização de dados. Essa é a primeira de 3 aulas relacionadas ao assunto e começa no instante 1:33:33.


Visualização de dados

Almanaque de gráficos: taxonomia, funções e formas

A escolha de um gráfico para represetação de dados é função do tipo de valor das variáveis a serem exibidas, do objetivo do gráfico (função) e de aspectos de forma. Com relação a função, os gráficos dividem-se em 7 grupos: distribuição, relação, ordenação, evolução, mapas, organização e fluxo. O almanaque de gráficos dessa aula reúne os principais gráficos usados para representação de dados. Para cada gráfico discute-se suas principais características, virtudes e deficiências. Comparações entre tipos de visualização são feitas visando estimular a visão crítica e escolhas baseadas em eficiência e expressividade.


Visualização de dados

Recursos no R e aplicações

O R é um ambiente em software livre e multiplataforma para computação estatística e gráficos. Possui muitos recursos para confecção de gráficos de alto padrão que uma das suas mais notáveis capacidades. O território de confeção de gráficos pode ser dividido em 4 partes: 1) recursos baseados no pacote graphics, 2) no pacote lattice, 3) no pacote ggplot2 e 4) recursos para visualização interativa. A implementação do ggplot2 é baseada na gramática dos gráficos proposta por Wilkinson em 1999 que é baseada, como o nome sugere, em elementos gráficos adicionados como camadas. Nessa apresentação são discutidas as funcionalidades dos recursos disponíveis. É dada ênfase na grámatica dos gráficos usando o pacote ggplot2. Ao final é uma análise exploratória para dados imobiliários em Curitiba. Nessa etapa são confecionados gráficos para compreender a relação entre variáveis e a distribuição espacial, onde são definidas medidas e calculadas métricas de relação e dependência espacial.


Planejamento de experimentos

Uma visão panorâmica

A primeiras contribuições para a área de planejamento e análise de experimentos foram de Ronald A. Fisher a quase de um século atrás. Desde então, a área de planejamento de experimentos tem evoluído e hoje é determinante para o avanço da pesquisa em todas as áreas da Ciências. Apesar da exigência e ampla adoção dos experimentos planejados, a incorreta compreensão ou emprego dos princípios fundamentais pode comprometer os resultados de pesquisas onerosas. Nesta aula são discutidos os princípios fundamentais de planejamentos experimentais, apresentada a terminologia, introduzido os experimentos fatoriais e feitas recomendações para os praticantes.


Planejamento de experimentos

Estudos de caso

Nesta aula são discutidos análises de conjuntos de dados reais enfatizando aspectos como transformação de dados, observações influentes, bandas de confiança e predição em regressão, comparações múltiplas, modelos de regressão não lineares e regressões locais.