Lista de Exercícios 1: Estatística Descritiva
LE409 (Estatística e Probabilidade para Engenharia)
Prof. Leonardo Tomazeli Duarte – FCA/UNICAMP
1. A Figura abaixo representa o histograma associado a um dado conjunto de dados. Dentre as
seguintes possibilidades:
1. média = 26.5 e mediana = 28;
2. média = 25 e mediana = 20
3. média = mediana = 29
Qual delas melhor representa o conjunto de dados associado ao histograma exibido?
Justifique sua resposta.
2. Considere os seguintes conjuntos de dados 𝑋 = {𝑥1 , 𝑥2 , … , 𝑥𝑁 } e 𝑌 = {𝑦1 , 𝑦2 , … , 𝑦𝑁 }, cujas
variâncias são dadas por 𝜎𝑋2 e 𝜎𝑌2 , respectivamente. Assumindo que os conjuntos 𝑋 e 𝑌
possuem média zero e que são descorrelacionados entre si, mostre que os conjuntos 𝑇 = 𝑋 −
𝑌 = {𝑥1 − 𝑦1 , 𝑥2 − 𝑦2 , … , 𝑥𝑁 − 𝑦𝑁 } e 𝑍 = 𝑋 + 𝑌 = {𝑥1 + 𝑦1 , 𝑥2 + 𝑦2 , … , 𝑥𝑁 + 𝑦𝑁 } possuem
a mesma variância e que esta é dada por 𝜎𝑋2 + 𝜎𝑌2 .
3. Considere o conjunto de dados Z={12,18,22,27,33,39}
(a) Calcule a média, a variância e o desvio padrão.
(b) Aplique a seguinte transformação a cada elemento: z′=2z+10. Calcule a nova média,
variância e desvio padrão.
(c) Comente os efeitos dessa transformação nos parâmetros estatísticos.
4. A Tabela 1 apresenta os salários de dois grupos de profissionais de áreas distintas.
Tabela 1. Distribuição dos salários por faixa
Faixa Salarial
Grupo A Grupo B
(mil R$)
0 – 10 8 25
10 – 20 15 20
20 – 30 22 15
Faixa Salarial
Grupo A Grupo B
(mil R$)
30 – 40 18 10
40 – 50 5 3
Total 68 73
(a) Construa os histogramas de frequência relativa para ambos os grupos.
(b) Estime a média, a mediana e a moda para cada grupo.
(c) Estime a variância, os quartis e a amplitude interquartílica de cada grupo.
5. Um conjunto de 4 amostras apresentou uma média de 76831 e desvio padrão de 180. Os
valores máximos e mínimos deste conjunto são de 76683 e 77048, respectivamente. Obtenha
o conjunto original de amostras.
6. Considere o conjunto de dados abaixo, que representa os tempos (em minutos) que
diferentes máquinas levaram para concluir uma mesma tarefa em um experimento industrial:
T={10, 32, 35, 37, 33, 36, 34, 38, 40, 31, 58, 34, 37, 39}
(a) Com base na distribuição dos d.ados, verifique se há presença de outliers. Utilize o
intervalo interquartil como critério.
(b) Qual é o impacto do outlier na média e no desvio padrão da amostra? Compare os valores
com e sem esse dado.
7. Construa um conjunto de dados (com 8 a 10 elementos) que satisfaçam as seguintes
condições:
(a) A média deve ser visivelmente maior que a mediana.
(b) A mediana e a moda devem ser iguais, mas a média deve ser diferente.
(c) A moda deve ser menor que a média, e a mediana deve estar entre as duas.
(d) Dois conjuntos X e Y devem ser construídos de modo que:
Var(X) = 4Var(Y)
8. A média aritmética é sensível a outliers. Uma possível estratégia para amenizar este
problema é aplicar uma transformação não-linear nos dados de modo que estes sejam
“achatados”, diminuindo assim a distância entre os dados próximos da tendência central e os
outliers. Na prática, este procedimento é feito da seguinte maneira:
- Estabelece-se uma função não-linear g(x) capaz de “achatar” os dados;
- Aplica-se essa função não-linear para cada uma das amostras do conjunto X = {x1, x2,...,
xN}, obtendo desta forma um novo conjunto de dados GX = {g(x1), g(x2),..., g(xN)}
- Calcula-se mGX, a média aritmética do conjunto GX
- Levando em conta mGX, define-se uma nova medida de tendência central para o conjunto X
como sendo g-1(mGX).
(a) Obtenha a expressão desta nova medida central no caso em que a função não-linear é dada
por g(x) = log(x) .
(b) Diferentemente da média aritmética, a expressão obtida pode ser aplicada apenas se os
dados respeitarem uma condição. Qual é esta condição?
(c) Para o conjunto X={1 2 3 1 2 3 4 100}, calcule a média aritmética e a nova medida de
tendência central obtida no item (a). Comente.
9. Forneça um conjunto de dados X de 10 amostras tal que:
(a) A média seja substancialmente maior que a mediana.
(b) A média e a mediana sejam iguais e os dados sejam tri-modais.
(c) A média seja substancialmente menor que a mediana.
(d) A moda seja maior que a média, e a média seja maior que a mediana.
(e) Forneça dois conjuntos de dados X e Y tal que a variância do conjunto X seja o dobro da
variância do conjunto Y.