0% acharam este documento útil (0 voto)
31 visualizações12 páginas

Exercicio Fixacao Aula00 Datawarehouse

O documento apresenta uma lista de questões sobre Data Warehouse e Data Mining, abordando conceitos, definições e aplicações práticas. As respostas corretas são acompanhadas de comentários explicativos que esclarecem as diferenças entre os conceitos e a importância do uso de técnicas de mineração de dados. Além disso, discute a estrutura e características de um Data Warehouse, bem como o processo de descoberta de conhecimento em bases de dados.

Enviado por

Celular Usiesp
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
31 visualizações12 páginas

Exercicio Fixacao Aula00 Datawarehouse

O documento apresenta uma lista de questões sobre Data Warehouse e Data Mining, abordando conceitos, definições e aplicações práticas. As respostas corretas são acompanhadas de comentários explicativos que esclarecem as diferenças entre os conceitos e a importância do uso de técnicas de mineração de dados. Além disso, discute a estrutura e características de um Data Warehouse, bem como o processo de descoberta de conhecimento em bases de dados.

Enviado por

Celular Usiesp
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 12

Lista das Questões Apresentadas na Aula

1. (CESPE/2016/TCE-PA/Auditor de Controle Externo - Área Informática - Analista de


Sistema) Julgue o item a seguir, em relação a data warehouse e data mining.

No contexto de data mining, o processo de descoberta de conhecimento em base de dados


consiste na extração não trivial de conhecimento previamente desconhecido e
potencialmente útil.

Resposta:

( X ) Certo

( ) Errado
Comentários

O Data Mining é considerado uma parte de um processo maior conhecido como KDD (Knowledge
Discovery in Databases) – em português, Descoberta de Conhecimento em Bases de Dados –, que,
segundo Eduardo Gimenes, busca extrair informação válida, previamente desconhecida e de
máxima abrangência a partir de grandes bases de dados, usando-as para efetuar de decisões
cruciais.

Addrians & Zantinge (1996) cita que o Data Mining, ou Mineração de Dados, permite a extração
não trivial de conhecimento previamente desconhecido e potencialmente útil de um banco de
dados.

Outra definição clássica para esse termo é a de FAYYAD et al. (1996): “processo, não trivial, de
extração de informações implícitas, previamente desconhecidas e potencialmente úteis, a partir dos
dados armazenados em um banco de dados”, ou seja, buscar por informações em uma base de dados
com os mais variados atributos e assuntos.

Já Laudon&Laudon destaca que Data Mining é a análise de grandes quantidades de dados


a fim de encontrar padrões e regras que possam ser usadas para orientar a tomada de
decisões e prever o comportamento futuro.

2. (Q104752/CESPE/2016/TCE-PA/Auditor de Controle Externo - Área Informática - Analista


de Sistema) Julgue o item a seguir, em relação a data warehouse e data mining.
[Data warehouse é um repositório de dados dinâmico, que sofre alterações frequentes, de
modo a permitir que sejam feitas consultas em base de dados constantemente atualizada].

Resposta:
( ) Certo

( X ) Errado
Comentários

A questão tornou-se inadequada ao destacar que o Data Warehouse sofre alterações frequentes.

Os dados em um Data Warehouse não são voláteis, ou seja, eles não mudam, salvo quando é
necessário fazer correções de dados previamente carregados. No ambiente operacional, ao contrário,
os dados sofrem alterações frequentes, pois são, em geral, atualizados registro a registro, em
múltiplas transações.

Figura. Carregamento e acesso a dados no DW

3. (CESPE/2015/TCU/Auditor Federal de Controle Externo) O uso prático de data mining


envolve o emprego de processos, ferramentas, técnicas e métodos oriundos da matemática,
da estatística e da computação, inclusive de inteligência artificial.

Resposta:

( X ) Certo

( ) Errado

Comentários

Data Mining é a etapa do KDD (Knowledge Discovery in Databases - Descoberta de Conhecimento


em Bases de Dados) em que os dados preparados são processados, ou seja, é onde se faz a mineração
dos dados propriamente dita. Nesse contexto, são aplicadas técnicas para identificação de padrões
sobre os dados disponíveis. Esse processo tem o intuito de trabalhar os dados registrados ao longo do
tempo de vida de um negócio a fim de se identificar padrões que representam alguma informação
sobre o comportamento do negócio.

A figura a seguir apresenta um esquema que descreve o KDD.


O processo de KDD envolve os seguintes passos:

1. entendimento do domínio da aplicação e identificação do objetivo do processo


de KDD;
2. seleção: criação de um conjunto-alvo de dados;

3. pré-processamento: limpeza de dados e operações básicas como remoção de ruído,


tratamento para a falta de dados, etc.;

4. transformação: encontrar características úteis para representar os dados,


conforme o objetivo definido e realizar a redução ou transformação da
dimensionalidade;

5. mineração de dados: casar os objetivos do processo de KDD com um método


particular de mineração de dados e realizar a análise exploratória e seleção
de modelo e hipótese, buscando padrões de interesse;

6. interpretação: interpretar e avaliar os padrões minerados, podendo retornar a


passos anteriores caso seja necessário;

7. agir a partir do conhecimento descoberto.

8. No Data Mining são aplicadas técnicas e ferramentas matemáticas, estatísticas e


computacionais visando a extração de informações implícitas, previamente
desconhecidas, e potencialmente úteis, a partir de dados. Para isso é necessário um
programa de computador para detectar padrões e regularidades nos dados. Os termos
destacados na questão estão de acordo com essa teoria, e a assertiva é correta.
4. (CESPE/2015/TCU/Auditor Federal de Controle Externo) No ambiente organizacional,
devido à grande quantidade de dados, não é recomendado o emprego de data mining para
atividades ligadas a marketing.

Resposta:

( ) Certo

( X ) Errado

Comentários

Não existe restrição de setor para o emprego das técnicas de Data mining. Em relação à
quantidade de dados também não há restrição desde que a empresa possua capacidade de
tratamento (armazenagem e processamento) dos dados.

5. (CESPE/2015/TCU/Auditor Federal de Controle Externo) A finalidade do uso do data mining


em uma organização é subsidiar a produção de afirmações conclusivas acerca do padrão de
comportamento exibido por agentes de interesse dessa organização.

Resposta:

( X ) Certo

( ) Errado

Comentários
A mineração de dados (Data Mining) pode ser utilizada para encontrar novos padrões, visando:

 predição: o sistema encontra padrões para predizer


(prever) o comportamento futuro de algumas entidades;
 descrição: o sistema encontra padrões relevantes sobre os dados, em
uma forma compreensível para o usuário.
A mineração de dados envolve o ajuste de modelos aos dados observados ou a
determinação de padrões a partir destes dados. Os modelos ajustados fazem o papel do
conhecimento inferido, sobre o qual o julgamento humano subjetivo é exigido na
verificação se os modelos refletem conhecimento útil ou interessante.

6. (CESPE/2015/DEPEN/AGENTE PENITENCIÁRIO FEDERAL – TECNOLOGIA DA INFORMAÇÃO) Acerca de


datawarehouse e datamining, julgue o item subsequente: [O datawarehouse possibilita a análise de
grandes volumes de dados, que, por sua vez, permitem a realização de uma melhor análise de
eventos futuros].

Resposta:
( ) Certo

( X ) Errado
Comentários

Um Data Warehouse é um repositório de informações colhidas de várias origens, armazenadas sob um


esquema unificado, em um único local.

Quando reunidos, os dados são armazenados por muito tempo, permitindo o acesso a dados históricos. Ainda,
o desenho da base de dados favorece os relatórios, a análise de grandes volumes de dados e a obtenção de
informações estratégicas que podem facilitar a tomada de decisão.

O Data Warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais
(OLTP). São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados,
oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros.

7. (Q104754/CESPE/2014/TJ-SE/Analista Judiciário/Análise de Sistemas) Com relação a sistemas de suporte


à decisão, julgue os seguintes itens.
Assim como o Data Mining, os Data Marts são voltados para a obtenção de informações estratégicas de
maneira automática, ou seja, com o mínimo de intervenção humana a partir da análise de dados oriundos
de Data Warehouses.

Resposta:

( ) Certo

( X ) Errado
Comentários
Data Marts são subconjuntos de dados de um Data Warehouse.
O Data Warehouse é um conjunto de dados orientado por assuntos, não volátil, variável com o tempo e
integrado, criado para dar suporte à decisão.

E, por fim, é o Data Mining (Mineração de Dados) o processo de identificar informações relevantes, tais
como padrões, associações, mudanças, anomalias e estruturas, em grandes conglomerados de dados
que estejam em banco de dados ou outros repositórios de informações.

8. (CESPE/2014/TJ-SE/Programação de Sistemas) Os dados armazenados em um DataWarehouse devem


estar integrados, temporalmente identificados, orientados ao assunto e devem ser protegidos, de modo a
se evitar o acesso do usuário.

Resposta:

( ) Certo

( X ) Errado
Comentários
Segundo Bill Inmon (1997), um data warehouse é uma coleção de dados orientada a assuntos,
integrada, não-volátil e variante ao longo do tempo, para suporte à tomada de decisão.
 É orientado a assuntos

o o DW é criado de forma orientada em torno dos principais assuntos da organização


(clientes, vendas, produtos, estoques, etc.).

• É integrado

o Na convenção consistente de nomes;

o Na estrutura consistente da codificação; etc.

• É não volátil

o Somente existem cargas e acessos (atualizações existe, mas


devido às manutenções).

• É variante no tempo

o Qualquer unidade de dado deve ter precisão em um ponto bem definido


do tempo.
Por fim, deve-se definir o nível de segurança a ser implementado no DW, de modo a que
se permita o acesso devido aos usuários autorizados. A questão afirma que o acesso do
usuário deve ser evitado, o que está errado!

9. (FCC/2013/TRT9R/Téc.Jud./Tec.Informação) A revista ClubeDelphi publicou o seguinte artigo:

Com o crescente aumento do volume de dados, surge a necessidade de ferramentas e mecanismos que
permitam que eles possam ser analisados de forma otimizada, uma vez que armazenam toda a trajetória da
empresa. Uma solução é a utilização de I que, em síntese, é utilizado para armazenar conjuntos de dados
organizados por assuntos, mantendo todo um histórico corporativo. Outro recurso muito utilizado e dos mais
importantes quando o objetivo é a busca de conhecimento, é o II, que é um processo que consiste na
identificação de informações relevantes que estão presentes em grandes bancos de dados ou repositórios,
geralmente realizado em três etapas: a exploração, a definição dos padrões e a validação dos dados. Estas
ferramentas e técnicas fazem parte do III, definido como um conjunto de métodos e conceitos que podem ser
implementados através de softwares com o intuito de utilizar os dados importantes da organização para
auxiliar no processo de tomada de decisões, proporcionando melhorias para a alta administração. Outra
tecnologia que pode prover uma melhor e mais flexível análise das informações, é o IV que permite uma
visão conceitual de forma multidimensional das informações da organização, de maneira que as informações
possam ser visualizadas e analisadas de diferentes perspectivas pelo usuário.

(http://www.devmedia.com.br/mineracao-de-dados-data-warehouse-datamining-bi-e-olap-atraves-
do-fastcube-revista-clubedelphi-146/26537)

As lacunas que completam corretamente o texto estão expressas em:


Resposta:

( )D

Comentários

Lacuna Conceito Descrição

I Data Utilizado para armazenar conjuntos de dados organizados


Warehouse por assuntos, mantendo todo um histórico corporativo.
Trata-se de uma coleção de dados orientada por
assunto, integrada, não- volátil, variante no tempo,
que dá apoio às decisões da administração.

II Data Mining Processo que consiste na identificação de informações


(Mineração relevantes que estão presentes em grandes bancos de
de Dados) dados ou repositórios, geralmente realizado em três
etapas: a exploração, a definição dos padrões e a
validação dos dados.

Em outras palavras, é o processo de identificar


informações relevantes, tais como padrões,
associações, mudanças, anomalias e estruturas, em
grandes conglomerados de dados que estejam em
banco de dados ou outros repositórios de
informações.
III Business Um conjunto de métodos e conceitos que podem ser
Intelligence implementados através de softwares com o intuito
de utilizar os dados importantes da organização para
auxiliar no processo de tomada de decisões,
proporcionando melhorias para a alta administração.

IV OLAP Permite uma visão conceitual de forma


(Online multidimensional das informações da organização, de
Analytical maneira que as informações possam ser visualizadas e
Processing) analisadas de diferentes perspectivas pelo usuário.

10. (FCC/2014/ICMS-RJ/Auditor Fiscal da Receita Estadual) Com o advento da tecnologia de


Data Warehousing, os ambientes de apoio à decisão passaram a ser denominados
ambientes de Data Warehouse (DW).

Em relação à tecnologia DW, é correto afirmar:


a) Um DW tem duas operações básicas: a carga dos dados (inicial e
incremental) e o acesso a estes dados em modo leitura. Depois de carregado,
um DW não necessita de operações de bloqueio por concorrência de usuários
no acesso aos seus dados.
b) Em um DW as convenções de nomes, valores de variáveis e outros atributos
físicos de dados como data types são bastante flexíveis. Para facilitar a tomada
de decisões, as informações são apresentadas de diferentes formas, da mesma
maneira que foram carregadas dos sistemas legados.
c) Um projetista de DW deve ter seu foco na modelagem dos dados e no
projeto de banco de dados. Um sistema transacional armazena as informações
agrupadas por assuntos de interesse da empresa que são mais importantes,
enquanto um DW é orientado a processos e deve ser desenvolvido para manter
disponíveis as transações realizadas diariamente.
d) Os dados de um DW são um conjunto dinâmico de registros de uma ou mais
tabelas, capturados em um momento de tempo predeterminado, por isso têm
que ser sempre atualizados.
e) Um sistema multidimensional, como o DW, deve atualizar o valor corrente
das informações e sua exatidão é válida por um tempo curto, por exemplo, o
valor total das notas fiscais processadas pela Receita às 12:00 de um dia pode
ser diferente às 18:00 do mesmo dia.

Resposta:

( )A

Comentários

Bill Inmon destaca que o Data Warehouse (DW) “é uma coleção de dados orientados por
assuntos, integrados, variáveis com o tempo e não voláteis, para dar suporte ao processo de
tomada de decisão“. Essas características podem ser descritas da seguinte forma:

 Orientado a assunto: refere-se ao fato do Data Warehouse (DW) ser


organizado conforme diferentes visões de negócio, ou seja,
armazena
informações sobre temas específicos importantes para o negócio da empresa. Ex.: Vendas,
Compras, etc.

 Integrado a partir de fontes de dados heterogêneas.

 Não volátil: os dados são sempre inseridos, nunca excluídos. Em um DW


não existem alterações de dados, somente a carga inicial e as consultas posteriores.

 Variável com tempo: posições históricas das atividades no tempo.

Conforme visto, a restrição de não volatilidade permite basicamente duas operações em um DW, que
são: a carga (inicial ou incremental) e consulta dos dados. Via de regra não há operações de
atualizações de registros, nem necessidade de operações de bloqueio por concorrência de usuários no
acesso
aos seus dados (o que acontece tipicamente em operações de escrita de dados), pois os dados em
um DW são apenas para leitura. Assim, a letra A é a resposta da questão.

11. (CESPE/Correios/Analista de Correios/Analista de Sistemas/Desenvolvimento de Sistemas/2011)


As ferramentas de software ETL (extract transform load) têm como função a extração de dados de
diversos sistemas, a transformação desses dados de acordo com as regras de negócio e a carga dos
dados em um data mart ou um DW.

Resposta:

( X ) Certo

( ) Errado

Comentários
As ferramentas de software ETL (Extract Transform Load - Extração Transformação Carga ) ,
conforme visto na figura seguinte, têm como função a extração de dados a partir dos sistemas de origem e,
geralmente, gravação em disco no ambiente de ETL antes de qualquer reestruturação dos dados.

Em seguida, é realizada a transformação desses dados de acordo com as regras de negócio e,


por fim, a carga dos dados em um Data Mart ou em um Data Warehouse (DW).

12. (CESPE/Correios/Analista de Correios/Analista de Sistemas/Desenvolvimento de Sistemas/2011)


Em um ambiente data warehouse (DW), é possível a análise de grandes volumes de dados, os quais
ficam disponíveis para serem alterados e manipulados pelo usuário.

Resposta:

( ) Certo

( X ) Errado

Comentário

Segundo Laudon & Laudon, um Data Warehouse (DW) é um banco de dados, com ferramentas de consulta e
relatório, que armazena dados atuais e históricos extraídos de vários sistemas operacionais e consolidados
para fins de análises e relatórios administrativos.

Em um ambiente DW, é possível a análise de grandes volumes de dados. No entanto, diferentemente do


ambiente operacional em que os dados são, em geral, atualizados registro a registro, em múltiplas
transações, o DW permite apenas a carga inicial dos dados e consultas a estes dados. Após serem
integrados e transformados, os dados são carregados em bloco para o Data Warehouse, para que estejam
disponíveis aos usuários para acesso.
Gabarito
1. Item correto.
2. Item errado.
3. Item correto.
4. Item errado.
5. Item correto.
6. Item errado.
7. Item errado.
8. Item errado.
9. Letra D.
10. Letra A.
11. Item correto.
12. Item errado.

Você também pode gostar