Concurso TCU 2021 – Análise de Dados

Descrição do Combo:

Este combo foi criado com o intuito de viabilizar para os concurseiros de TI a compra de todos os resumos que poderão auxiliar na preparação para o Concurso Público do Tribunal de Contas da União – TCU 2021 para a disciplina de Análise de Dados!

Informações Gerais do Concurso:

  • Instituição: Tribunal de Contas da União – TCU
  • Banca Examinadora: FGV
  • Cargo: Auditor Federal de Controle Externo
  • Vencimento Básico: R$ 21.947,82
  • Vagas: 20 + CR
  • Data de Inscrição: 01/11 a 20/12/2021
  • Data da Prova: 13/03 e 22/05/2022

Mapa da Mina para os Conhecimentos Específicos de Análise de Dados:

Aviso: O Mapa da Mina é uma aproximação entre o conteúdo do edital e os Resumos de TI lançados até o momento em nosso site. O objetivo é indicar os resumos que darão a melhor cobertura possível do edital do concurso. Para os demais assuntos do edital que não estão presentes na listagem abaixo, não possuímos resumos publicados.
Estruturação dos Dados
  • Dados estruturados e não estruturados.
  • Dados abertos.
  • Coleta, tratamento, armazenamento, integração e recuperação de dados.
  • Processos de ETL.
  • Formatos e tecnologias: XML, JSON, CSV.
  • Representação de dados numéricos, textuais e estruturados; aritmética computacional.

Mineração de Dados (Data Mining)

  • Exploração de dados: conceituação e características.
  • Noções do modelo CRISP-DM.
  • Técnicas para pré-processamento de dados.
  • Técnicas e tarefas de mineração de dados.
  • Classificação.
  • Regras de associação.
  • Análise de agrupamentos (clusterização).
  • Detecção de anomalias.
  • Modelagem preditiva.

Processamento de Linguagem Natural (PLN)

  • Conceitos de PLN:
    • Semântica vetorial, redução de dimensionalidade, modelagem de tópicos latentes, classificação de textos, análise de sentimentos, representações com n-gramas.

Aprendizado de Máquina (Machine Learning)

  • Conceitos de ML:
    • Fontes de erro em modelos preditivos, validação e avaliação de modelos preditivos, underfitting, overfitting e técnicas de regularização, otimização de hiperparâmetros, separabilidade de dados, redução da dimensionalidade.
    • Modelos lineares, árvores de decisão, redes neurais feed-forward, classificador Naive Bayes.

Linguagem Python

  • Sintaxe, variáveis, tipos de dados e estruturas de controle de fluxo.
  • Estruturas de dados, funções e arquivos.
  • Bibliotecas: NLTK, Tensor Flow, Pandas, Numpy, Arrow, Sklearn, Scipy.

Noções da Linguagem R

  • Sintaxe, tipos de dados, operadores, comandos de repetição, estruturas de dados, gráficos, Data frames.
  • Tidyverse.

Pareamento de Dados (Record Linkage)

  • Processo e etapas.
  • Classificação.
  • Qualidade de dados pareados.
  • Análise de dados pareados.

Atenção! Não estão incluídos neste Combo os seguintes assuntos:

  • Estruturação dos Dados
    • Representação de dados espaciais para georeferenciamento e geosensoriamento.
  • Banco de Dados
    • Bancos de dados relacionais: teoria e implementação.
    • Uso do SQL como DDL, DML, DCL.
    • Processamento de transações.
  • Segurança da Informação
    • Confidencialidade, integridade, disponibilidade, autenticidade e não repúdio.
    • Políticas de segurança.
    • Políticas de classificação da informação.
    • Sistemas de gestão de segurança da informação.
    • Tratamento de incidentes de segurança da informação.
  • Legislação
    • Lei de Acesso à Informação (Lei nº 12.527/2011): conceitos e aplicação.
    • Lei 13.709/2018, Lei Geral de Proteção de Dados Pessoais (LGPD).

Bons estudos e boa sorte,

Equipe Resumos de TI

Resumos incluídos neste combo:

  • Ciência de Dados - A Estruturação dos Dados_v1
  • Ciência de Dados - Noções de Big Data e Pareamento de Dados (Record Linkage)_v1
  • Ciência de Dados - Noções de Mineração de Dados (Data Mining) e Processamento de Linguagem Natural (PLN)_v1
  • Ciência de Dados - Noções de Aprendizado de Máquina (Machine Learning)_v1
  • Banco de Dados - Sistemas de Apoio à Decisão_v2
  • Desenvolvimento de Sistemas - Linguagem Python_v1
  • Desenvolvimento de Sistemas - Noções da Linguagem R_v1
  • Fundamentos de Computação - Sistemas de Numeração e Codificação_v2