Concurso TCU 2021 – Análise de Dados
Descrição do Combo:
Este combo foi criado com o intuito de viabilizar para os concurseiros de TI a compra de todos os resumos que poderão auxiliar na preparação para o Concurso Público do Tribunal de Contas da União – TCU 2021 para a disciplina de Análise de Dados!
Informações Gerais do Concurso:
- Instituição: Tribunal de Contas da União – TCU
- Banca Examinadora: FGV
- Cargo: Auditor Federal de Controle Externo
- Vencimento Básico: R$ 21.947,82
- Vagas: 20 + CR
- Data de Inscrição: 01/11 a 20/12/2021
- Data da Prova: 13/03 e 22/05/2022
Mapa da Mina para os Conhecimentos Específicos de Análise de Dados:
Aviso: O Mapa da Mina é uma aproximação entre o conteúdo do edital e os Resumos de TI lançados até o momento em nosso site. O objetivo é indicar os resumos que darão a melhor cobertura possível do edital do concurso. Para os demais assuntos do edital que não estão presentes na listagem abaixo, não possuímos resumos publicados.
Estruturação dos Dados
-
Dados estruturados e não estruturados.
-
Dados abertos.
-
Coleta, tratamento, armazenamento, integração e recuperação de dados.
-
Processos de ETL.
-
Formatos e tecnologias: XML, JSON, CSV.
- Representação de dados numéricos, textuais e estruturados; aritmética computacional.
Mineração de Dados (Data Mining)
-
Exploração de dados: conceituação e características.
-
Noções do modelo CRISP-DM.
-
Técnicas para pré-processamento de dados.
-
Técnicas e tarefas de mineração de dados.
-
Classificação.
-
Regras de associação.
-
Análise de agrupamentos (clusterização).
-
Detecção de anomalias.
-
Modelagem preditiva.
Processamento de Linguagem Natural (PLN)
-
Conceitos de PLN:
-
Semântica vetorial, redução de dimensionalidade, modelagem de tópicos latentes, classificação de textos, análise de sentimentos, representações com n-gramas.
-
Aprendizado de Máquina (Machine Learning)
- Conceitos de ML:
- Fontes de erro em modelos preditivos, validação e avaliação de modelos preditivos, underfitting, overfitting e técnicas de regularização, otimização de hiperparâmetros, separabilidade de dados, redução da dimensionalidade.
-
Modelos lineares, árvores de decisão, redes neurais feed-forward, classificador Naive Bayes.
Linguagem Python
- Sintaxe, variáveis, tipos de dados e estruturas de controle de fluxo.
-
Estruturas de dados, funções e arquivos.
-
Bibliotecas: NLTK, Tensor Flow, Pandas, Numpy, Arrow, Sklearn, Scipy.
Noções da Linguagem R
- Sintaxe, tipos de dados, operadores, comandos de repetição, estruturas de dados, gráficos, Data frames.
-
Tidyverse.
Pareamento de Dados (Record Linkage)
- Processo e etapas.
-
Classificação.
-
Qualidade de dados pareados.
-
Análise de dados pareados.
Atenção! Não estão incluídos neste Combo os seguintes assuntos:
- Estruturação dos Dados
-
Representação de dados espaciais para georeferenciamento e geosensoriamento.
-
- Banco de Dados
-
Bancos de dados relacionais: teoria e implementação.
-
Uso do SQL como DDL, DML, DCL.
-
Processamento de transações.
-
- Segurança da Informação
- Confidencialidade, integridade, disponibilidade, autenticidade e não repúdio.
-
Políticas de segurança.
-
Políticas de classificação da informação.
-
Sistemas de gestão de segurança da informação.
-
Tratamento de incidentes de segurança da informação.
- Legislação
-
Lei de Acesso à Informação (Lei nº 12.527/2011): conceitos e aplicação.
-
Lei 13.709/2018, Lei Geral de Proteção de Dados Pessoais (LGPD).
-
Bons estudos e boa sorte,
Equipe Resumos de TI
Resumos incluídos neste combo:
- Ciência de Dados - A Estruturação dos Dados_v1
- Ciência de Dados - Noções de Big Data e Pareamento de Dados (Record Linkage)_v1
- Ciência de Dados - Noções de Mineração de Dados (Data Mining) e Processamento de Linguagem Natural (PLN)_v1
- Ciência de Dados - Noções de Aprendizado de Máquina (Machine Learning)_v1
- Banco de Dados - Sistemas de Apoio à Decisão_v2
- Desenvolvimento de Sistemas - Linguagem Python_v1
- Desenvolvimento de Sistemas - Noções da Linguagem R_v1
- Fundamentos de Computação - Sistemas de Numeração e Codificação_v2