0% acharam este documento útil (0 voto)

8 visualizações140 páginas

06 Estatistica

apostila de estatística

Enviado por

CauaBerger

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

0% acharam este documento útil (0 voto)

8 visualizações140 páginas

06 Estatistica

apostila de estatística

Enviado por

CauaBerger

Direitos autorais

Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.

Formatos disponíveis

Baixe no formato PDF, TXT ou leia on-line no Scribd

Você está na página 1/ 140

Polícia Federal

1 Estatística descritiva e análise exploratória de dados: gráficos, diagramas, tabelas,

medidas descritivas (posição, dispersão, assimetria e curtose). ............................................... 1
2 Probabilidade. 2.1 Definições básicas e axiomas. 2.2 Probabilidade condicional e
independência. 2.3 Variáveis aleatórias discretas e contínuas. 2.4 Distribuição de
probabilidades. 2.5 Função de probabilidade. 2.6 Função densidade de probabilidade. 2.7
Esperança e momentos. 2.8 Distribuições especiais. 2.9 Distribuições condicionais e
independência. 2.10 Transformação de variáveis. 2.11 Leis dos grandes números. 2.12
Teorema central do limite. 2.13 Amostras aleatórias. 2.14 Distribuições amostrais. ............... 63
3 Inferência estatística. 3.1 Estimação pontual: métodos de estimação, propriedades dos
estimadores, suficiência. 3.2 Estimação intervalar: intervalos de confiança, intervalos de
credibilidade. 3.3 Testes de hipóteses: hipóteses simples e compostas, níveis de significância
e potência de um teste, teste t de Student, teste qui-quadrado. ........................................... 100
4 Análise de regressão linear. 4.1 Critérios de mínimos quadrados e de máxima
verossimilhança. 4.2 Modelos de regressão linear. 4.3 Inferência sobre os parâmetros do
modelo. 4.4 Análise de variância. 4.5 Análise de resíduos. .................................................. 123
5 Técnicas de amostragem: amostragem aleatória simples, estratificada, sistemática e por
conglomerados. 5.1 Tamanho amostral. ............................................................................... 135

Olá Concurseiro, tudo bem?

Sabemos que estudar para concurso público não é tarefa fácil, mas acreditamos na sua
dedicação e por isso elaboramos nossa apostila com todo cuidado e nos exatos termos do
edital, para que você não estude assuntos desnecessários e nem perca tempo buscando
conteúdos faltantes. Somando sua dedicação aos nossos cuidados, esperamos que você
tenha uma ótima experiência de estudo e que consiga a tão almejada aprovação.

Pensando em auxiliar seus estudos e aprimorar nosso material, disponibilizamos o e-mail

[email protected] para que possa mandar suas dúvidas, sugestões ou
questionamentos sobre o conteúdo da apostila. Todos e-mails que chegam até nós, passam
por uma triagem e são direcionados aos tutores da matéria em questão. Para o maior
aproveitamento do Sistema de Atendimento ao Concurseiro (SAC) liste os seguintes itens:

01. Apostila (concurso e cargo);

02. Disciplina (matéria);
03. Número da página onde se encontra a dúvida; e
04. Qual a dúvida.

Caso existam dúvidas em disciplinas diferentes, por favor, encaminhar em e-mails separados,
pois facilita e agiliza o processo de envio para o tutor responsável, lembrando que teremos até
cinco dias úteis para respondê-lo (a).

Não esqueça de mandar um feedback e nos contar quando for aprovado!

Bons estudos e conte sempre conosco!

1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS

1 Estatística descritiva e análise exploratória de dados: gráficos, diagramas,
tabelas, medidas descritivas (posição, dispersão, assimetria e curtose).

Introdução
Todas as ciências têm suas raízes na história do homem.
Desde a Antiguidade muitos povos já faziam uso dos recursos da Estatística, através de registro de
número de óbitos, nascimentos, número de habitantes, além das estimativas das riquezas individuais e
sociais, entre muitas outras.
Na Idade Média as informações colhidas tinham como finalidade tributária e bélica.
Somente a partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais,
originando as primeiras tábuas e tabelas e os primeiros números relativos.
No século XVII o estudo de tais fatos foi adquirido, aos poucos, feição verdadeiramente científica.
Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu
objetivo e suas relações com as ciências.
A estatística não se limita somente a compilar tabelas de dados e os ilustrar graficamente. Ela é, hoje
em dia, um instrumento útil e, em alguns casos, indispensável para tomadas de decisão em diversos
campos: científico, econômico, social, político….
Todavia, antes de chegarmos à parte de interpretação para tomadas de decisão, há que proceder a
um indispensável trabalho de recolha e organização de dados, sendo a recolha feita através de
recenseamentos (ou censos ou levantamentos estatísticos) ou sondagens.
Estatística pode ser pensada como a ciência de aprendizagem a partir de dados. No nosso cotidiano,
precisamos tomar decisões, muitas vezes decisões rápidas.
Em linhas gerais a Estatística fornece métodos que auxiliam o processo de tomada de decisão através
da análise dos dados que possuímos.
Podemos ainda dizer que a Estatística é:

É a ciência que se ocupa de coletar, organizar, analisar e interpretar dados para que se tomem
decisões.

Em resumo:

A ESTATÍSTICA é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, análise e interpretação de dados e para utilização dos mesmos na tomada de
decisões.

Divisão da estatística
- Estatística Descritiva: coleta, organização e descrição dos dados. Ela preocupa-se com a forma
pela qual podemos apresentar um conjunto de dados em tabelas e gráficos, e também resumir as
informações contidas nestes dados mediante a utilização de medidas estatísticas.

- Estatística Indutiva ou Inferencial: análise e a interpretação desses dados. A inferência estatística

baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo um grupo (chamado
população), quando se observou apenas uma parte (amostra) representativa desta população.

Método Estatístico
Atualmente quase todo acréscimo de conhecimento resulta da observação e do estudo. A verdade é
que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos, ou
seja desenvolvemos maneiras ou métodos para tais fins.

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.
Podemos destacar dois métodos:

1
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
- Método experimental: consiste em manter constantes todas as causas (fatores), menos uma, e
variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. Muito utilizado
no estudo da Física, da Química etc

- Método estatístico: diante da impossibilidade de manter as causas constantes, admite todas essas
causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final,
que influências cabem a cada uma delas.

Fases do método estatístico

- Coleta de dados: após cuidadoso planejamento e a devida determinação das características
mensuráveis do fenômeno que se quer pesquisar, damos início à coleta de dados numéricos necessários
à sua descrição.

A coleta pode ser:

Direta: quando é feita sobre elementos informativos Indireta: quando é indeferida de elementos
de registro obrigatório (nascimento, casamentos e conhecidos (coleta direta) e/ou de
óbitos, importação e exportação de mercadorias), conhecimento de outros fenômenos
dados coletados pelo próprio pesquisador através de relacionados com o fenômeno estudado.
inquéritos e questionários, como por exemplo o censo Exemplo: pesquisas de mortalidade infantil,
demográfico. A coleta direta de dados pode ser que é feita através de dados colhidos por uma
classificada em fator do tempo: coleta direta (número de nascimentos versus
(i) contínua (registro) – quando feita continuamente. números de obtidos de crianças)
(ii) periódica – quando feita em intervalos constantes
de tempo (exemplo o censo de 10 em 10 anos, etc)
(iii) ocasional – quando feita extemporaneamente, a
fim de atender uma conjuntura ou a uma emergência
(caso de epidemias)

- Crítica dos dados: depois de obtidos os dados, os mesmos devem ser cuidadosamente criticados,
à procura de possível falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo
vulto, que possam influir sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas.
A crítica é interna quando visa observar os elementos originais dos dados da coleta.

- Apuração dos dados: soma e processamento dos dados obtidos e a disposição mediante critérios
de classificação, que pode ser manual, eletromecânica ou eletrônica.

- Exposição ou apresentação de dados: os dados devem ser apresentados sob forma adequada
(tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.

- Análise dos resultados: realizadas anteriores (Estatística Descritiva), fazemos uma análise dos
resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução
ou inferência, e tiramos desses resultados conclusões e previsões.

Mais alguns conceitos devem ser aprendidos para darmos continuidade ao nosso entendimento sobre
Estatística.

- Variáveis: conjunto de resultados possíveis de um fenômeno.

As variáveis podem ser:
1) Qualitativas – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor
da pele, entre outros. Dizemos que estamos qualificando.
2) Quantitativas – quando seus valores são expressos em números (salários dos operários, idade dos
alunos, etc). Uma variável quantitativa que pode assumir qualquer valor entre dois limites recebe o nome
de variável contínua; e uma variável que só pode assumir valores pertencentes a um conjunto
enumerável recebe o nome de variável discreta.

2
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
- População estatística ou universo estatístico: conjunto de entes portadores de, pelo menos, uma
característica comum.
Exemplos: estudantes (os que estudam), concurseiros (os que prestam concursos), ...
Podemos ainda pesquisar uma ou mais características dos elementos de alguma população, as quais
devem ser perfeitamente definidas. É necessário existir um critério de constituição da população, válido
para qualquer pessoa, no tempo ou no espaço.

- Amostra: é um subconjunto finito de uma população.

A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados
verificados em amostras retiradas dessa população. É preciso garantir que a amostra possua as mesmas
características da população, no que diz respeito ao fenômeno que desejamos pesquisar.

Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população.

Principais propriedades:
- Admite erros processual zero e tem 100% de confiabilidade;
- É caro;
- É lento;
- É quase sempre desatualizado (visto que se realizam em períodos de anos 10 em 10 anos);
- Nem sempre é viável.

Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo
de probabilidades.
Principais da Estimação:
- Admite erro processual positivo e tem confiabilidade menor que 100%.
- É barata.
- É rápida.
- É atualizada.
- É sempre viável.

Dados brutos: quando observamos ou fazemos n perguntas as quais nos dão n dados ou respostas,
obtemos uma sequência de n valores numéricos. A toda sequência denominamos dados brutos.

Dados brutos é uma sequência de valores numéricos não organizados, obtidos diretamente da
observação de um fenômeno coletivo.
Rol: é uma sequência ordenada dos dados brutos.
Exemplo: Um aluno obteve as seguintes notas no ano letivo em Matemática: 5,5 ; 7 ; 6,5 ; 9
Os dados brutos é a sequência descrita acima
Rol: 5,5 – 6,5 – 7 – 9 (ordenação crescente das notas).
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999
TAVARES, Prof. Marcelo – Estatística Aplicada à Administração – Sistema Universidade Aberta do Brasil- 2007
Reis, Marcelo Menezes - Estatística aplicada à administração / Marcelo Menezes Reis. –Florianópolis: Departamento de Ciências da Administração /UFSC, 2008.

3
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Questões

01. (Câmara Munic. Itatiba/SP – Analista de Recursos Humanos – VUNESP) Em estatística, a

técnica que nos permite fazer inferências sobre uma população, a partir da análise de uma parte dela,
denomina-se
(A) dedução.
(B) amostragem.
(C) probabilidade.
(D) descrição.
(E) extração.

02. (EBSERH – Analista Administrativo – Estatística (HE-UFSCAR) – INSTITUTO AOCP) Que

parte da estatística se preocupa apenas em descrever determinada característica da população?
(A) Regressão estatística.
(B) Estatística contínua.
(C) Estatística descritiva.
(D) Estatística amostral.
(E) Estatística inferencial.

03. (EBSERH – Médico do Trabalho – IADES) “Costuma ser encontrada com maior frequência em
jornais, revistas ou relatórios. Essa parte da estatística utiliza números para descrever fatos. Seu foco é
a representação gráfica e o resumo e organização de um conjunto de dados, com a finalidade de
simplificar informações.” O texto faz referência à:
(A) Estatística inferencial
(B) Estatística de probabilidade
(C) Estatística por amostragem
(D) Estatística descritiva
(E) Média aritmética

04. (ANS – Ativ. Téc. de Complexidade Intelectual - Administração – FUNCAB) A estatística

descritiva:
(A) permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza;
estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e
conclusões obtidas a partir da amostra.
(B) é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e
interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
(C) é a etapa inicial da análise, utilizada para descrever e resumir os dados, que foi revigorada pela
disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes.
(D) é a etapa conclusiva da análise, utilizada para descrever e resumir os dados e permite descrever
os fenômenos aleatórios ou seja, aqueles em que está presente a incerteza.
(E) é a etapa inicial da análise, utilizada para descrever e resumir dados; estuda as técnicas que
possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a
partir da amostra.

Respostas

01. Resposta: B.

02. Resposta: C.

03. Resposta: D.

04. Resposta: C.

MÉDIA ARITMÉTICA

Considere um conjunto numérico A = {x1; x2; x3; ...; xn} e efetue uma certa operação com todos os
elementos de A.

4
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Se for possível substituir cada um dos elementos do conjunto A por um número x de modo que o
resultado da operação citada seja o mesmo diz – se, por definição, que x será a média dos elementos de
A relativa a essa operação.

Média Aritmética Simples1

A média dos elementos do conjunto numérico A relativa à adição é chamada média aritmética.

Cálculo da média aritmética

Se x for a média aritmética dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn}, então, por
definição:

A média aritmética(x) dos n elementos do conjunto numérico A é a soma de todos os seus

elementos, dividida pelo número de elementos n.
Exemplos:
1) Calcular a média aritmética entre os números 3, 4, 6, 9, e 13.
Se x for a média aritmética dos elementos do conjunto (3, 4, 6, 9, 13), então x será a soma dos 5
elementos, dividida por 5. Assim:

3 + 4 + 6 + 9 + 13 35
𝑥= ↔𝑥= ↔𝑥=7
5 5

A média aritmética é 7.

2) Os gastos (em reais) de 15 turistas em Porto Seguro estão indicados a seguir:

65 – 80 – 45 – 40 – 65 – 80 – 85 – 90
75 – 75 – 70 – 75 – 75 – 90 – 65

Se somarmos todos os valores teremos:

65 + 80 + 45 + 40 + 65+, , , +90 + 65 1075

𝑥= = = 71,70
15 15

Assim podemos concluir que o gasto médio do grupo de turistas foi de R$ 71,70.

Questões

01. (Câmara Municipal de São José dos Campos/SP – Analista Técnico Legislativo – Designer
Gráfico – VUNESP) Na festa de seu aniversário em 2014, todos os sete filhos de João estavam
presentes. A idade de João nessa ocasião representava 2 vezes a média aritmética da idade de seus
filhos, e a razão entre a soma das idades deles e a idade de João valia
(A) 1,5.
(B) 2,0.
(C) 2,5.
(D) 3,0.
(E) 3,5.

02. (TJ/SC - Técnico Judiciário - Auxiliar TJ-SC) Os censos populacionais produzem informações
que permitem conhecer a distribuição territorial e as principais características das pessoas e dos
domicílios, acompanhar sua evolução ao longo do tempo, e planejar adequadamente o uso sustentável
dos recursos, sendo imprescindíveis para a definição de políticas públicas e a tomada de decisões de
investimento. Constituem a única fonte de referência sobre a situação de vida da população nos
municípios e em seus recortes internos – distritos, bairros e localidades, rurais ou urbanos – cujas
realidades socioeconômicas dependem dos resultados censitários para serem conhecidas.
http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.shtm

1
IEZZI, Gelson – Matemática – Volume Único

5
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
(Acesso dia 29/08/2011)
Um dos resultados possíveis de se conhecer, é a distribuição entre homens e mulheres no território
brasileiro. A seguir parte da pirâmide etária da população brasileira disponibilizada pelo IBGE.

http://www.ibge.gov.br/censo2010/piramide_etaria/index.php
(Acesso dia 29/08/2011)
O quadro abaixo, mostra a distribuição da quantidade de homens e mulheres, por faixa etária de uma
determinada cidade. (Dados aproximados)
Considerando somente a população masculina dos 20 aos 44 anos e com base no quadro abaixo a
frequência relativa, dos homens, da classe [30, 34] é:

(A) 64%.
(B) 35%.
(C) 25%.
(D) 29%.
(E) 30%.

03. (EsSA - Sargento - Conhecimentos Gerais - Todas as Áreas – EB) Em uma turma a média
aritmética das notas é 7,5. Sabe-se que a média aritmética das notas das mulheres é 8 e das notas dos
homens é 6. Se o número de mulheres excede o de homens em 8, pode-se afirmar que o número total
de alunos da turma é
(A) 4.
(B) 8.
(C) 12.
(D) 16.
(E) 20.

04. (SAP/SP - Oficial Administrativo – VUNESP) A altura média, em metros, dos cinco ocupantes de
um carro era y. Quando dois deles, cujas alturas somavam 3,45 m, saíram do carro, a altura média dos
que permaneceram passou a ser 1,8 m que, em relação à média original y, é
(A) 3 cm maior.
(B) 2 cm maior.
(C) igual.
(D) 2 cm menor.
(E) 3 cm menor.

05. (PC/SP – Oficial Administrativo – VUNESP) Em uma empresa com 5 funcionários, a soma dos
dois menores salários é R$ 4.000,00, e a soma dos três maiores salários é R$ 12.000,00. Excluindo-se o
menor e o maior desses cinco salários, a média dos 3 restantes é R$ 3.000,00, podendo-se concluir que
a média aritmética entre o menor e o maior desses salários é igual a
(A) R$ 3.500,00.
(B) R$ 3.400,00.
(C) R$ 3.050,00.
(D) R$ 2.800,00.
(E) R$ 2.500,00.

6
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Comentários

01. Alternativa: E.
Foi dado que: J = 2.M

𝑎+𝑏+⋯+𝑔
𝐽= 7
= 2. 𝑀 (I)

𝑎+𝑏+⋯+𝑔
Foi pedido: 𝐽
=?

Na equação ( I ), temos que:

𝑎+𝑏+⋯+𝑔
7= 𝐽

7 𝑎+𝑏+⋯+𝑔
2
= 𝑀

𝑎 + 𝑏 + ⋯+ 𝑔
= 3,5
𝑀

02. Alternativa: E.
[30, 34] = 600, somatória de todos os homens é: 300+400+600+500+200= 2000
600 600
300+400+600+500+200
= 2000 = 0,3 . (100) = 30%

03. Alternativa: D.
Do enunciado temos m = h + 8 (sendo m = mulheres e h = homens).
𝑆
A média da turma é 7,5, sendo S a soma das notas: 𝑚+ℎ = 7,5 → 𝑆 = 7,5(𝑚 + ℎ)

𝑆1
A média das mulheres é 8, sendo S1 a soma das notas: = 8 → 𝑆1 = 8𝑚
𝑚

𝑆2
A média dos homens é 6, sendo S2 a soma das notas: ℎ
= 6 → 𝑆2 = 6ℎ

Somando as notas dos homens e das mulheres:

S1 + S2 = S
8m + 6h = 7,5(m + h)
8m + 6h = 7,5m + 7,5h
8m – 7,5m = 7,5h – 6h
0,5m =1,5h
1,5ℎ
𝑚 = 0,5
𝑚 = 3ℎ
h + 8 = 3h
8 = 3h – h
8 = 2h → h = 4
m = 4 + 8 = 12
Total de alunos = 12 + 4 = 16

04. Alternativa: A.
Sendo S a soma das alturas e y a média, temos:
𝑆
5
= 𝑦 → S = 5y

𝑆−3,45
= 1,8 → S – 3,45 = 1,8.3
3
S – 3,45 = 5,4

7
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
S = 5,4 + 3,45
S = 8,85, então:
5y = 8,85
y = 8,85 : 5 = 1,77
1,80 – 1,77 = 0,03 m = 3 cm a mais.

05. Alternativa: A.
x1 + x2 + x3 + x4 + x5
x1 + x2 = 4000
x3 + x4 + x5 = 12000

𝑥2 + 𝑥3 + 𝑥4
= 3000
3

x2 + x3 + x4 = 9000
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 4000 + 12000 = 16000

Sendo 𝑥1 𝑒 𝑥5 o menor e o maior salário, respectivamente:

𝑥1 + 9000 + 𝑥5 = 16000

𝑥1 + 𝑥5 = 16000 − 9000 = 7000

Então, a média aritmética:

𝑥1 + 𝑥2 7000
= = 3500
2 2

Média Aritmética Ponderada

A média dos elementos do conjunto numérico A relativa à adição e na qual cada elemento tem um
“determinado peso” é chamada média aritmética ponderada2.

Cálculo da média aritmética ponderada

Se x for a média aritmética ponderada dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn} com
“pesos” P1; P2; P3; ...; Pn, respectivamente, então, por definição:

P1 . x + P2 . x + P3 . x + ... + Pn . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn ↔ (P1 + P2 + P3 + ... + Pn) . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn e, portanto,

𝑥1 ; 𝑥2 ; 𝑥3 ; …; 𝑥𝑛
Observe que se P1 = P2 = P3 = ... = Pn = 1, então 𝑥 = 𝑛
: que é a média aritmética simples.

A média aritmética ponderada dos n elementos do conjunto numérico A é a soma dos produtos de
cada elemento multiplicado pelo respectivo peso, dividida pela soma dos pesos.

Exemplos:
1) Calcular a média aritmética ponderada dos números 35, 20 e 10 com pesos 2, 3, e 5,
respectivamente.

Se x for a média aritmética ponderada, então:

2 .35 + 3 .20 + 5 .10 70 + 60 + 50 180

𝑥= ↔𝑥= ↔𝑥= ↔ 𝑥 = 18
2+3+5 10 10

2
IEZZI, Gelson – Matemática – Volume Único

8
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
A média aritmética ponderada é 18.

2) Em um dia de pesca nos rios do pantanal, uma equipe de pescadores anotou a quantidade de peixes
capturada de cada espécie e o preço pelo qual eram vendidos a um supermercado em Campo Grande.

Tipo de peixe Quilo de peixe pescado Preço por quilo

Peixe A 18 R$ 3,00
Peixe B 10 R$ 5,00
Peixe C 6 R$ 9,00

Vamos determinar o preço médio do quilograma do peixe vendido pelos pescadores ao supermercado.
Considerando que a variável em estudo é o preço do quilo do peixe e fazendo a leitura da tabela,
concluímos que foram pescados 18 kg de peixe ao valor unitário de R$ 3,00, 10 kg de peixe ao valor
unitário de R$ 5,00 e 6 kg de peixe ao valor de R$ 9,00.
Vamos chamar o preço médio de p:

18𝑥3,00 + 10𝑥5,00 + 6𝑥9,00 54 + 50 + 54 158

𝑝= = = = 4,65 𝑟𝑒𝑎𝑖𝑠
18 + 10 + 6 34 34

Neste caso o fator de ponderação foi a quantidade de peixes capturadas de cada espécie.

A palavra média, sem especificações (aritmética ou ponderada), deve ser entendida como média
aritmética.

Questões

01. (EPCAR – Cadete – EPCAR) Um líquido L1 de densidade 800 g/l será misturado a um líquido L2
de densidade 900 g/l Tal mistura será homogênea e terá a proporção de 3 partes de L1 para cada 5 partes
de L2 A densidade da mistura final, em g/l, será
(A) 861,5.
(B) 862.
(C) 862,5.
(D) 863.

02. (TJM-SP – Oficial de Justiça – VUNESP) Ao encerrar o movimento diário, um atacadista, que
vende à vista e a prazo, montou uma tabela relacionando a porcentagem do seu faturamento no dia com
o respectivo prazo, em dias, para que o pagamento seja efetuado.

PORCENTUAL DO PRAZO PARA

FATURAMENTO PAGAMENTO (DIAS)
15% À vista
20% 30
35% 60
20% 90
10% 120

O prazo médio, em dias, para pagamento das vendas efetuadas nesse dia, é igual a
(A) 75.
(B) 67.
(C) 60.
(D) 57.
(E) 55.

03. (SEDUC/RJ - Professor – Matemática – CEPERJ) Uma loja de roupas de malha vende camisetas
com malha de três qualidades. Cada camiseta de malha comum custa R$15,00, de malha superior custa
R$24,00 e de malha especial custa R$30,00. Certo mês, a loja vendeu 180 camisetas de malha comum,
150 de malha superior e 70 de malha especial. O preço médio, em reais, da venda de uma camiseta foi
de:

9
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
(A) 20.
(B) 20,5.
(C) 21.
(D) 21,5.
(E) 11.

04. (CÂMARA MUNICIPAL DE SÃO JOSÉ DO RIO PRETO/SP – Programador de Computador –

FIP) A média semestral de um curso é dada pela média ponderada de três provas com peso igual a 1 na
primeira prova, peso 2 na segunda prova e peso 3 na terceira. Qual a média de um aluno que tirou 8,0
na primeira, 6,5 na segunda e 9,0 na terceira?
(A) 7,0
(B) 8,0
(C) 7,8
(D) 8,4
(E) 7,2

05. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática

– FUNCAB) A tabela abaixo mostra os valores mensais do Imposto Predial e Territorial Urbano (IPTU)
pagos pelos apartamentos de um condomínio. Determine a média aritmética desses valores.

Número de Apartamentos Valor de IPTU Pago

5 R$ 180,00
5 R$ 200,00
10 R$ 220,00
10 R$ 240,00
4 R$ 300,00
6 R$ 400,00

(A) R$ 248,50
(B) R$ 252,50
(C) R$ 255,50
(D) R$ 205,50
(E) R$ 202,50

06. (SAP/SP - AGENTE DE SEGURANÇA PENITENCIÁRIA DE CLASSE I – VUNESP) Em uma

seção de uma empresa com 20 funcionários, a distribuição dos salários mensais, segundo os cargos que
ocupam, é a seguinte:

Sabendo-se que o salário médio desses funcionários é de R$ 1.490,00, pode-se concluir que o salário
de cada um dos dois gerentes é de
(A) R$ 2.900,00.
(B) R$ 4.200,00.
(C) R$ 2.100,00.
(D) R$ 1.900,00.
(E) R$ 3.400,00.

07. (UFPE - Assistente em Administração – COVEST) Em um concurso existem provas de

Português, Matemática, Informática e Conhecimentos Específicos, com pesos respectivos 2, 3, 1 e 4. Um
candidato obteve as seguintes notas nas provas de Português, Matemática e Informática:

Disciplina Nota
Português 77
Matemática 62
Informática 72

10
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Se a nota do candidato no concurso foi 80, qual foi a sua nota na prova de Conhecimentos Específicos?
(A) 95
(B) 96
(C) 97
(D) 98
(E) 99

08. (VUNESP – FUNDUNESP – Assistente Administrativo) Um concurso teve duas fases, e, em

cada uma delas, os candidatos foram avaliados com notas que variaram de zero a dez. Para efeito de
classificação, foram consideradas as médias ponderadas de cada candidato, uma vez que os pesos da
1.ª e da 2.ª fases foram 2 e 3, respectivamente. Se um candidato tirou 8 na 1.ª fase e 5 na 2.ª, então é
verdade que sua média ponderada foi
(A) 6,2.
(B) 6,5.
(C) 6,8.
(D) 7,1.
(E) 7,4.

09. (SAAE/SP - Fiscal Leiturista – VUNESP) A tabela mostra os valores de algumas latinhas de
bebidas vendidas em um clube e a quantidade consumida por uma família, em certo dia.

Bebidas (latinha) Valor unitário Quantidade Consumida

Refrigerante R$ 4,00 8
Suco R$ 5,00 6
Cerveja X 4

Considerando-se o número total de latinhas consumidas por essa família nesse dia, na média, o preço
de uma latinha saiu por R$ 5,00. Então, o preço de uma latinha de cerveja era
(A) R$ 5,00.
(B) R$ 5,50.
(C) R$ 6,00.
(D) R$ 6,50.
(E) R$ 7,00.

10. (Instituto de Pesquisas Tecnológicas – Secretária – VUNESP) Em um edifício residencial, 14

unidades pagam uma taxa mensal de condomínio no valor de 930 reais. Para as 28 unidades restantes,
que são menores, a taxa mensal de condomínio também é menor. Sabendo-se que o valor médio da taxa
mensal de condomínio, nesse edifício, é de 750 reais, é correto afirmar que o valor em reais que cada
unidade menor paga mensalmente de condomínio é igual a
(A) 600.
(B) 620.
(C) 660.
(D) 700.
(E) 710.

Comentários

01. Alternativa: C.
3.800+5.900 2400+4500 6900
3+5
= 8
= 8 = 862,5

02. Alternativa: D.
Média aritmética ponderada: multiplicamos o porcentual pelo prazo e dividimos pela soma dos
porcentuais.
15.0+20.30+35.60+20.90+10.120
15+20+35+20+10
=

600+2100+1800+1200
= =
100

11
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
5700
= 100
= 57

03. Alternativa: C.
Também média aritmética ponderada.
180.15+150.24+70.30
180+150+70
=

2700+3600+2100
= 400
=

8400
= 400
= 21

04. Alternativa: B.
Na média ponderada multiplicamos o peso da prova pela sua nota e dividimos pela soma de todos os
pesos, assim temos:
8.1 + 6,5.2 + 9.3 8 + 13 + 27 48
𝑀𝑃 = = = = 8,0
1+2+3 6 6

05. Alternativa: B.

5.180 + 5.200 + 10.220 + 10.240 + 4.300 + 6.400 10100

𝑀= = = 252,50
5 + 5 + 10 + 10 + 4 + 6 40

06. Alternativa: C.

2𝑥 + 8 ∙ 1700 + 10 ∙ 1200
𝑀é𝑑𝑖𝑎 =
20
2𝑥 + 8 ∙ 1700 + 10 ∙ 1200
1490 =
20

2𝑥 + 13600 + 12000 = 29800

2𝑥 = 4200
𝑥 = 2100
Cada um dos gerentes recebem R$ 2100,00

07. Alternativa: C.

2.77 + 3.62 + 1.72 + 4. 𝑥

= 80
2+3+1+4
412 + 4. 𝑥
= 80
10

4x + 412 = 80 . 10
4x = 800 – 412
x = 388 / 4
x = 97

08. Alternativa: A.
2.8 + 3.5 16 + 15 31
𝑀𝑝 = = = = 6,2
2+3 5 5

09. Alternativa: E.

8.4 + 6.5 + 4. 𝑥
=5
8+6+4

12
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
62 + 4. 𝑥
=5
18

4.x = 90 – 62
x = 28 / 4
x = R$ 7,00

10. Resposta: C.

𝟏𝟒 . 𝟗𝟑𝟎 + 𝟐𝟖 . 𝒙
= 𝟕𝟓𝟎
𝟏𝟒 + 2𝟖
𝟏𝟑𝟎𝟐𝟎 + 𝟐𝟖 . 𝒙
= 𝟕𝟓𝟎
𝟒𝟐

13020 + 28.x = 42 . 750

28.x = 31500 – 13020
x = 18480 / 28
x = R$ 660,00

MÉDIA GEOMÉTRICA

Este tipo de média é calculado multiplicando-se todos os n valores e extraindo-se a raiz de índice n
deste produto. (n≥2)

Em uma fórmula: a média geométrica de a1, a2, ..., an é

A média geométrica de um conjunto de números é sempre menor ou igual à média aritmética dos
membros desse conjunto (as duas médias são iguais se e somente se todos os membros do conjunto são
iguais). Isso permite a definição da média aritmética geométrica, uma mistura das duas que sempre tem
um valor intermediário às duas.
A média geométrica é também a média aritmética harmônica no sentido que, se duas sequências (an)
e (hn) são definidas:

Então an e hn convergem para a média geométrica de x e y.

Exemplo:

Digamos que tenhamos os números 4, 6 e 9, para obtermos média geométrica deste conjunto,
multiplicamos os elementos e obtemos o produto 216.
Pegamos então este produto e extraímos a sua raiz cúbica, chegando ao valor médio 6.
Extraímos a raiz cúbica, pois o conjunto é composto de 3 elementos. Se fossem n elementos,
extrairíamos a raiz de índice n.

Neste exemplo teríamos a seguinte solução:

13
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
bUtilidades da Média Geométrica

Progressão Geométrica
Uma das utilizações deste tipo de média é na definição de uma progressão geométrica que diz que
em toda PG., qualquer termo é média geométrica entre o seu antecedente e o seu consequente:

Tomemos como exemplo três termos consecutivos de uma PG.: 7, 21 e 63.

Temos então que o termo 21 é média geométrica dos termos 7 e 63.

Vejamos:

Variações Percentuais em Sequência

Outra utilização para este tipo de média é quando estamos trabalhando com variações percentuais em
sequência.

Exemplo
Digamos que uma categoria de operários tenha um aumento salarial de 20% após um mês, 12% após
dois meses e 7% após três meses. Qual o percentual médio mensal de aumento desta categoria?
Sabemos que para acumularmos um aumento de 20%, 12% e 7% sobre o valor de um salário,
devemos multiplicá-lo sucessivamente por 1,2, ; 1,12 e 1,07 que são os fatores correspondentes a tais
percentuais.
A partir daí podemos calcular a média geométrica destes fatores:

Como sabemos, um fator de 1, 128741 corresponde a 12, 8741% de aumento.

Este é o valor percentual médio mensal do aumento salarial, ou seja, se aplicarmos três vezes
consecutivas o percentual 12, 8741%, no final teremos o mesmo resultado que se tivéssemos aplicado
os percentuais 20%, 12% e 7%.
Digamos que o salário desta categoria de operários seja de R$ 1.000,00, aplicando-se os sucessivos
aumentos temos:

Salário Inicial +% Salário final Salário inicial + % médio Salário final

Informado
R$ 1.000,00 20% R$ 1.200,00 R$ 1.000,00 12, 8417 R$ 1.128,74
R$ 1.200,00 12% R$ 1.334,00 R$ 1.287,74 12, 8417 R$ 1.274,06
R$ 1.334,00 7% R$ 1.438,00 R$ 1.274,06 12, 8417 R$ 1.438,08

Observe que o resultado final de R$ 1.438,08 é o mesmo nos dois casos. Se tivéssemos utilizado a
média aritmética no lugar da média geométrica, os valores finais seriam distintos, pois a média aritmética
de 13% resultaria em um salário final de R$ 1.442,90, ligeiramente maior como já era esperado, já que o
percentual de 13% utilizado é ligeiramente maior que os 12, 8417% da média geométrica.

Cálculo da Média Geométrica Triangular

Bom... primeiro observamos o mapa e somamos as áreas dos quadrados catetos e dividimos pela
hipotenusa e no final pegamos a soma dos ângulos subtraindo o que está entre os catetos e dividimos
por PI (3,1415...) assim descobrimos a média geométrica dos triângulos.

Exemplo:
A média geométrica entre os números 12, 64, 126 e 345, é dada por:

G = R4[12 ×64×126×345] = 76,013

14
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Aplicação Prática:
Dentre todos os retângulos com a área igual a 64 cm², qual é o retângulo cujo perímetro é o menor
possível, isto é, o mais econômico? A resposta a este tipo de questão é dada pela média geométrica entre
as medidas do comprimento a e da largura b, uma vez que a.b = 64.

A média geométrica G entre a e b fornece a medida desejada.

G = R[a × b] = R[64] = 8

Resposta:
É o retângulo cujo comprimento mede 8 cm e é lógico que a altura também mede 8 cm, logo só pode
ser um quadrado! O perímetro neste caso é p = 32 cm. Em qualquer outra situação em que as medidas
dos comprimentos forem diferentes das alturas, teremos perímetros maiores do que 32 cm.

Interpretação gráfica
A média geométrica entre dois segmentos de reta pode ser obtida geometricamente de uma forma
bastante simples.
Sejam AB e BC segmentos de reta. Trace um segmento de reta que contenha a junção dos segmentos
AB e BC, de forma que eles formem segmentos consecutivos sobre a mesma reta.

Dessa junção aparecerá um novo segmento AC. Obtenha o ponto médio O deste segmento e com um
compasso centrado em O e raio OA, trace uma semicircunferência começando em A e terminando em C.
O segmento vertical traçado para cima a partir de B encontrará o ponto D na semicircunferência. A medida
do segmento BD corresponde à média geométrica das medidas dos segmentos AB e BC.

MÉDIA HARMÔNICA

A Média harmônica é o inverso da média aritmética do inverso dos referidos números:

Exemplo:
Calcular a média Harmônica entre 3 e 4.

Basta calcular a média entre os inversos dos números 3 e 4 e depois inverte-los, ou seja,

1 1
+
3 4= 7
2 24

7 −1 24
Logo a Média Harmônica é: 𝐻 = ( ) = ≅ 3,42
24 7

Questões

01. (Pref. de Pinhais/PR – Médico Veterinário – FAFIPA) Qual é a média geométrica dos números
2 e 8?
(A) 2
(B) 4
(C) 6
(D) 8

15
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
02. DPE/RS – Analista – FCC) A média geométrica dos números 4, 8 e 16 é
(A) maior que a respectiva média aritmética.
(B) inferior a 6.
(C) igual a 8.
(D) igual a 4.
(E) superior a 9.

03. (SEFAZ/RJ – Analista de Controle Interno – FGV) A média geométrica simples entre os valores
{3; 9; 3; 1} é
(A) 2.
(B) 3.
(C) 4.
(D) 3,25.
(E) 3,5.

04. (FUB – Assistente Administrativo – CESPE) Os números x, y e z estão, nessa ordem, em

progressão aritmética de razão 3 e os números x, z e w estão, nessa ordem, em progressão geométrica
de razão 4. Com relação a essa situação,
Julgue os itens que se seguem.
A média geométrica entre os números x, z e w é igual a 9.
( ) Certo ( ) Errado

05. (ANAC – Especialista em Regulação de Aviação Civil – CESPE) Considerando que uma
pesquisa de satisfação referente a um novo terminal de passageiros tenha sido realizada com 50 pessoas
e o resultado em uma amostra de notas conforme apresentado na tabela abaixo, julgue os itens seguintes.

A média geométrica da distribuição das notas foi superior à média aritmética.

( ) Certo ( ) Errado

06. (IF/RN – Professor – FUNCERN) Considere que os números a,b e c são reais positivos e que a é
a média geométrica entre x2 e b.
Se, b é a média geométrica entre a/3 e 2x, então, o valor de y para b3=xy é

(A)

(B)

(C)

(D)

07. (TSE – Analista Judiciário – CONSULPLAN) O valor absoluto da diferença entre a média
geométrica e a média aritmética de X = {2, 2, 2, 2, 4, 16, 128, 128} é
(A) 19,5.
(B) 33,5.
(C) 31,5.
(D) 27,5.

16
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
08. (ARTESP – Especialista em Regulação de Transporte I – FCC - Adaptada) Considere as
seguintes informações:
I. (A) = média harmônica dos números 4, 6 e 12.
II. (B) = média geométrica dos números 6, 12 e 24.
A média aritmética de (A) + (B) é igual a
(A) 6.
(B) 9.
(C) 12.
(D) 18.
(E) 36.

Comentários

01. Resposta: B
Para encontrar a média geométrica basta multiplicarmos os termos e extrairmos a raiz cujo índice é
igual a quantidade de termos, então teremos:
2 2
√2.8 = √16 = 4

02. Resposta: C
Para encontrar a média geométrica basta multiplicarmos os termos e extrairmos a raiz cujo índice é
igual a quantidade de termos, então teremos:
3 3 3
√4.8.16 = √512 = √29 = 23 = 8.

03. Resposta: B
Para encontrar a média geométrica basta multiplicarmos os termos e extrairmos a raiz cujo índice é
igual a quantidade de termos, então teremos:
4 4 4
√3.9.3.1 = √81 = √34 = 3.

04. Resposta: Errado

Como x, y, z estão em progressão aritmética de razão 3, temos que:

y=x+3
z=y+3=x+3+3=x+6

Depois ele diz o seguinte:

x, z, w estão em progressão geométrica de razão 4, logo
z = 4.x
Assim se igualarmos o valor de z nas duas etapas teremos:

x + 6 = z = 4x
x + 6 = 4x
6 = 4x – x
6 = 3x
6/3 = x
x=2

Portanto x = 2, disso concluímos que:

y=x+3=2+3=5
z=x+6=2+6=8
w = 4z = 4.8 = 32
Precisamos calcular a média geométrica entre x, z, w, assim teremos:
3 3 3
√2.8.32 = √21 . 23 . 25 = √29 = 23 = 8.
Logo é falsa, pois a média geométrica é igual a 8 e não 9.

05. Resposta: Errado

Para resolver esta questão não precisa se desesperar, basta se lembrar de algo muito simples,
chamado desigualdade das médias, ou seja, a média aritmética é maior ou igual à média geométrica e
esta maior ou igual à média harmônica, assim esta afirmação é errada.

17
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
06. Resposta: A
Para resolver este problema, devemos expressar os valores de forma a gerar uma equação.
Temos o seguinte:
2
√𝑥 2 . 𝑏 = 𝑎 (*)
e também,
2 𝑎
√ 3 . 2𝑥 = 𝑏 (**)
Vamos isolar o “a” em (**) e substituir em (*).
𝑎
. 2𝑥 = 𝑏2
3
𝑏 2.3 3𝑏²
𝑎= =
2𝑥 2𝑥

Vamos substituir em (*) agora

2
√𝑥 2 . 𝑏 = 𝑎
2 3𝑏²
√𝑥 2 . 𝑏 =
2𝑥
2
2 3𝑏 2
𝑥 . 𝑏 = ( 2𝑥 )
9.𝑏 4
𝑥2 . 𝑏 = 4𝑥 2
𝑏4
𝑥 2 . 4𝑥 2 = 9. 𝑏
4𝑥 4
9
= 𝑏³

Agora foi pedido para calcular o valor de y para b3=xy, vamos arrumar essa equação, ou seja, isolando
o y.
𝑏³ 4𝑥 4
= 𝑦, mas sabemos que b³ = , substituindo então:
𝑥 9

4𝑥4
9
𝑥 = 𝑦
1

4𝑥 4
9𝑥
= 𝑦
4𝑥 3
9
= 𝑦
Portanto alternativa A.

07. Resposta: D
Para resolver este problema precisamos calcular a média aritmética e a média geométrica dos termos.

Média aritmética:
2+2+2+2+4+16+128+128 284
8
= 8
= 35,5

Média geométrica:
8 8 8
√2.2.2.2.4.16.128.128 = √2¹. 2¹. 2¹. 2¹. 2². 24 . 27 . 27 = √224 = 23 = 8

Agora basta fazer a diferença entre elas, assim teremos:

35,5 – 8 = 27,5.

08. Resposta: B
Para resolver este problemas devemos encontrar a média harmônica de I e a média geométrica de II,
a seguir basta calcular a média aritmética simples dos dois resultados obtidos, portanto vamos lá!
Média harmônica de I.
Para o cálculo da média harmônica, basta calcularmos o inverso da média dos inversos, ou seja,
𝑛
Média harmônica = 1 1 1 1
+ + +⋯+
𝑥1 𝑥2 𝑥3 𝑥𝑛
3
H=1 1 1 =
+ +
4 6 12

18
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
1 1 1
Primeiramente vamos calcular a soma 4 + 6 + 12 através do MMC.
1 1 1
4
+ 6 + 12 =
3 2 1 6 1
12
+ 12 + 12 = 12 = 2

3 2
H = 1 = 3. 1 = 6
2

Agora vamos calcular a média geométrica de II.

3 3 3
√6.12.24 = √21 . 31 . 22 . 31 . 23 . 3¹ = √26 . 3³ = 22 . 31 = 12

Basta encontrarmos a média aritmética simples entre 6 e 12, portanto:

6 + 12 18
= =9
2 2
MEDIANA E MODA

A moda e a mediana são utilizados para resumirem um conjunto de valores dado uma série estatística.
Vamos ver os conceitos de cada uma delas:
A mediana, é uma medida de localização do centro da distribuição dos dados.
A moda, é o valor que aparece com maior frequência, ou seja, podemos dizer que é o termo que está
na “moda”.

Exemplo:
Em um time de futebol temos as seguintes altura dos atletas:

(Fonte: http://geniodamatematica.com.br)

Ache o valor da mediana e da moda.

Resolução:
Primeiramente precisamos colocar os dados de forma ordenada, ou seja, montar o rol:

Altura Frequência
1,48 1
1,52 1
1,60 1
1,61 1
1,62 1
1,64 1
1,66 3
1,68 1
1,69 1

Para acharmos a mediana precisamos ver se a quantidade de valores, se for ímpar a mediana é o
valor que ocupa a posição central, se for par a mediana corresponde à média aritmética dos dois
valores centrais.

19
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
No nosso caso temos que é ímpar:

Altura Frequência
1º 1,48 1
2º 1,52 1
3º 1,60 1
4º 1,61 1
5º 1,62 1
6º 1,64 1
7º 1,66 3
8º 1,68 1
9º 1,69 1

Então a mediana é o valor que está na 5ª linha: 1,62

E a moda é 1,66, que é o valor que aparece com maior frequência.

Questões

01. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática

– FUNCAB) Determine a mediana do conjunto de valores (10, 11, 12, 11, 9, 8, 10, 11, 10, 12).
(A) 8,5
(B) 9
(C) 10,5
(D) 11,5
(E) 10

02. (IF/GO – Assistente de Alunos – UFG) A tabela a seguir apresenta o índice de desenvolvimento
humano (IDH) de alguns países da América Latina referente ao ano 2012.

Países IDH
Argentina 0,811
Bolívia 0,645
Brasil 0,730
Chile 0,819
Colômbia 0,719
Cuba 0,780
México 0,775
Uruguai 0,792
Venezuela 0,758
Disponível em: <http://www.abinee.org.br/abinee/decon/decon55a.htm>. Acesso em: 24 fev. 2014. (Adaptado).

Dentre os países listados, aquele cujo IDH representa a mediana dos dados apresentados é:
(A) Brasil
(B) Colômbia
(C) México
(D) Venezuela

03. (Polícia Militar/SP – Aluno – Oficial – VUNESP) Na tabela, as letras q, p e m substituem as

alturas, relacionadas em ordem crescente, de seis alunos do Curso de Formação de Oficiais da Polícia
Militar avaliados em um exame biométrico, sendo que, nessa tabela, letras iguais correspondem a alturas
iguais.
Nome Altura (em centímetros)
Gonçalves q
Camargo q
Pacheco q
Mendes p
Santos m
Ferreira m

20
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Sabendo-se que a moda, a mediana e a média aritmética das alturas desses alunos são,
respectivamente, 173 cm, 174,5 cm e 175,5 cm, pode-se concluir que a altura do aluno Ferreira é igual,
em centímetros, a
(A) 177.
(B) 178.
(C) 179.
(D) 180.
(E) 182.

(SEFAZ/RJ – ANALISTA DE CONTROLE INTERNO – CEPERJ) Observe os números relacionados

a seguir, e responda às questões de números 04 e 05.

4 7 3
9 6 8
8 7 8

04. A mediana desses valores vale:

(A) 6
(B) 6,5
(C) 7
(D) 7,5
(E) 8

05. A moda desses valores vale:

(A) 8
(B) 7
(C) 6
(D) 5
(E) 4

Comentários

01. Resposta: C.
Coloquemos os valores em ordem crescente:
8, 9, 10, 10, 10, 11, 11, 11, 12, 12
Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente,
temos que:
10 + 11 21
𝑀= = = 10,5
2 2

02. Resposta: C.
Vamos colocar os números em ordem crescente:
0,645 0,719 0,730 0,758 0,775 0,780 0,792 0,811 0,819
O número que se encontra no meio é 0,775 (México).

03. Resposta: C.
* Se a moda é 173 cm, então q = 173 cm (Gonçalves, Camargo e Pacheco).
* Se a mediana é 174,5 cm, então (q + p) / 2 = 174,5.
q + p = 174,5 . 2
q + p = 349 cm
* Se a média aritmética é 175,5 cm, então:
3. 𝑞 + 𝑝 + 2. 𝑚
𝑀= = 17
6
2. 𝑞 + 𝑞 + 𝑝 + 2. 𝑚
= 175,5
6

2.173 + 349 + 2.m = 175,5 . 6

346 + 349 + 2.m = 1053

21
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
2.m = 1053 – 695
m = 358 / 2
m = 179 cm

04. Resposta: C.
Colocando em ordem crescente:
3; 4; 6; 7; 7; 8; 8; 8; 9
São 9 elementos, então a mediana é o quinto elemento(9+1/2)
Mediana 7

05. Resposta: A.
Moda é o elemento que aparece com mais frequência: 8

DISTRIBUIÇÃO DE FREQUÊNCIA

Usamos a distribuição de frequência3 para organizarmos os dados estatísticos resultantes de variáveis

quantitativas (as que usam os números para expressar-se) e fazemos a tabulação dos dados, ou seja, a
colocação dos dados de forma ordenada em uma tabela, para assim melhor interpreta-los.

Distribuição de frequência sem intervalo de classe

Quando temos variáveis discretas (possuem número finito de valores entre quaisquer dois valores) a
sua variação é relativamente pequena, cada valor pode ser tomado como um intervalo de classe.
Exemplo:
Uma professora organizou as notas que seus 25 alunos obtiveram em uma de suas provas, da seguinte
forma:

Observe que ela já ordenou os dados brutos (rol) o que ajuda a fazermos a tabulação dos dados.
Tabulando teremos:

O número de vezes que um dado aparece é chamado de FREQUÊNCIA ABSOLUTA representado

por f ou fi (varia de acordo com a bibliografia estudada). Também podemos representar a frequência em
forma de porcentagem, a esta damos o nome de FREQUÊNCIA RELATIVA (fr). Ela é o quociente entre
a frequência absoluta e o número de elementos da população total.

3 CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002

22
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Podemos ainda através desta tabulação encontrar a FREQUÊNCIA ABSOLUTA ACUMULADA (fa,
Fa ou Fi), na qual é a soma da frequência absoluta com a do anterior.

Observe que a última linha da Frequência Absoluta Acumulada é SEMPRE IGUAL ao somatório total
dos dados. Temos ainda a FREQUÊNCIA RELATIVA ACUMULADA (fra), que é a razão entre a
frequência absoluta acumulada e a frequência absoluta acumulada total de dados, é a forma percentual
de representarmos esses dados.

O exemplo acima mostra a distribuição de frequência para dados não agrupados. Quando trabalhamos
com uma quantidade grande de dados, a melhor forma é agrupa-los, afim de ganharmos simplicidade,
mesmo que perdemos os pormenores.

Nota:
Muitas bibliografias tendem a definir os termos de seus elementos estatísticos de formas variadas,
dando nome aos seus elementos de formas diferentes. Porém devemos levar em consideração o princípio
de cada um, o seu uso e relevância dentro do tratamento dos dados.
Colocamos aqui algumas dessas definições para o mesmo elemento para que você possa estar
contextualizado sobre o assunto.

23
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Distribuição de frequência para dados agrupados

Para melhor entendimento vamos acompanhar um exemplo e assim destacaremos os elementos

desse tipo de distribuição e os meios de montarmos sua tabela.

Exemplo:
Uma pesquisa feita com 40 alunos de uma escola C, revelou os seguintes dados sobre a estatura de
seus alunos (estaturas dadas em cm):

Observe que os dados não estão ordenados, então devemos organiza-los para assim conseguirmos
analisarmos, montando assim o nosso Rol:

Com isso já fica evidente qual a menor (150 cm) e a maior (173 cm) estatura deste grupo de alunos, e
sua concentração está entre 160 e 165 cm.

Se montássemos uma tabela semelhante a do exemplo anterior, exigiria muito espaço, mesmo a nossa
amostra tendo uma quantidade de valores razoável (40 alunos). Então convém agruparmos esses valores
em vários intervalos. Com isso teremos a seguinte tabela de distribuição de frequência com intervalo de
classes.
ESTATURA DOS 40 ALUNOS
DA ESCOLA C

Para montarmos uma tabela com tal agrupamento, precisamos saber algumas definições:

- Classes de frequência ou classes: são intervalos de variação da variável. Elas são simbolicamente
representadas por i, sendo i = 1,2,3, ..., k (onde k é o número total de classes da distribuição).
Por exemplo o intervalo 158 ├- 162 define a 3ª classe (i = 3), de um total de 6 classes, k = 6.

Depois aplicamos a fórmula de Sturges (regra do Logaritmo) dada por:

Aplicando no nosso exemplo temos: k = 1 + 3,3 .log 40 → k = 1 + 3,3 .1,60 → k = 1 + 5,28 → k = 6,28,
arredondando temos k = 6.

24
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Dica
Quantidade de classes x quantidade de dados

Já sabemos que vamos precisar de 6 classes para agruparmos nossos dados. Agora precisamos
descobrir quantos dados vamos agrupar juntos, ou seja, qual o tamanho ou amplitude do nosso intervalo,
para isso precisaremos de mais algumas informações.

- Amplitude amostral ou total (AA): diferença entre o valor máximo e o valor mínimo da amostra.
AA = x (máx.) – x (min.)

Sabemos que o menor valor da nossa amostra é 150 e o maior 173, aplicando teremos:
AA = 173 – 150 = 23 cm

- Amplitude das classes (h): é a divisão entre a amplitude total e o número de classes. O valor desta
divisão só poderá ser arredondado para mais.
𝑨𝑨
𝒉=
𝒌

Para nosso exemplo temos:

𝐴𝐴 23
ℎ= →ℎ= = 3,83 ≅ 4
𝑘 6

Assim agruparemos os dados de 4 em 4: 150 ao 154; 154 ao 158, ..., 170 ao 174, completando nossas
6 classes. Lembrando que como utilizamos o símbolo “├- “não estamos considerando o valor final, por
isso o repetimos no intervalo seguinte.
Com isso, conseguimos chegar a nossa tabela inicial.

Tome Nota: Podemos chamar a amplitude de classes também como Amplitude de um intervalo de
classe ou intervalo de classe (hi) que é a medida do intervalo que define a classe. Obtemos ela através
da diferença do limite superior e inferior de cada classe. Uma vez que conhecemos e temos os intervalos
podemos encontra-la facilmente.
hi = Li – li

Outras informações são importantes e relevantes ao nosso estudo, como meio de chegarmos a outras
análises. Vejamos:

- Limite de classe: são os extremos de cada classe. O menor chamamos de limite inferior da classe
(li) e o maior, o limite superior da classe (Li).
Tomando como exemplo a 3ª classe, temos:
l3 = 158 e L3 = 162

25
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Fique por dentro!

O símbolo ├- , indica uma inclusão do valor de li (limite inferior) e exclusão do valor de Li (limite
superior).
O símbolo ├-┤, indica uma inclusão tanto do valor de li (limite inferior) como do valor de Li (limite
superior).
O símbolo -┤, , indica uma exclusão do valor de li (limite inferior) e inclusão do valor de Li (limite
superior).

- Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe e o limite
inferior da última classe.
AT = L (máx.) – l (mín.)

Em nosso caso temos: AT = 174 – 150 = 24 cm

Observação: A amplitude total da distribuição (AT) JAMAIS coincide com a amplitude amostral (AA).

- Ponto médio de uma classe (xi): é o ponto que divide o intervalo de classe em duas partes iguais.
É o valor que a representa. Para sua obtenção calculamos a média aritmética entre os limites da classe
(superior e inferior).
𝒍𝒊 + 𝑳𝒊
𝒙𝒊 =
𝟐
Exemplo:
O ponto médio da 4ª classe é:

𝑙4 + 𝐿4 162 + 166 328

𝑥4 = → 𝑥4 = → 𝑥4 = → 𝑥4 = 164 𝑐𝑚
2 2 2

Questões

01. (ESA – Combatente/Logística – EXÉRCITO BRASILEIRO) Identifique a alternativa que

apresenta a frequência absoluta (fi) de um elemento (xi) cuja frequência relativa (fr) é igual a 25 % e cujo
total de elementos (N) da amostra é igual a 72.
(A) 18.
(B) 36.
(C) 9.
(D) 54.
(E) 45.

02. (BNDES – Técnico Administrativo – CESGRANRIO) Em uma faculdade, uma amostra de 120
alunos foi coletada, tendo-se verificado a idade e o sexo desses alunos. Na amostra, apurou-se que 45
estão na faixa de 16 a 20 anos, 60, na faixa de 21 a 25 anos, e 15 na faixa de 26 a 30 anos. Os resultados
obtidos encontram-se na Tabela abaixo.

Quais são, respectivamente, os valores indicados pelas letras P, Q, R e S?

(A) 40; 28; 64 e 0
(B) 50; 28; 64 e 7
(C) 50; 40; 53,3 e 7
(D) 77,8; 28; 53,3 e 7
(E) 77,8; 40; 64 e 0

26
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
03. (IMESC – Oficial Administrativo – VUNESP) Na tabela a seguir, constam informações sobre o
número de filhos dos 25 funcionários de uma pequena empresa.

Com base nas informações contidas na tabela, é correto afirmar que o número total de filhos dos
funcionários dessa pequena empresa é necessariamente
(A) menor que 41.
(B) igual a 41.
(C) maior que 41 e menor que 46.
(D) igual a 46.
(E) maior ou igual a 46.

Comentários

01. Resposta: A.
f_r=f_i/N
f_i=0,25∙72=18

02. Resposta: B.
Pela pesquisa 45 alunos estão na faixa de 16 a 20
São 10 do sexo masculino, portanto são 45-10=35 do sexo feminino.
70---100%
35----P
P=50%
70---100%
Q---40%
Q=28
35+28+S=70
S=7
Pela última coluna(% de sexo masculino):
20+R+16=100
R=64
P=50; Q=28; R=64; S=7

03. Resposta: E.
1 filho: 7 pessoas -7 filhos
2 filhos: 5 pessoas – 5.2=10 filhos
3 filhos: 3 pessoas – 3.3=9
Já são 26 filhos.
Temos mais 5 pessoas que tem mais de 3 filhos, o número mínimo são 4 filhos.
5.4=20
26+20=46 filhos no mínimo.

TABELAS E GRÁFICOS

O nosso cotidiano é permeado das mais diversas informações, sendo muito delas expressas em
formas de tabelas e gráficos4, as quais constatamos através do noticiários televisivos, jornais, revistas,
entre outros. Os gráficos e tabelas fazem parte da linguagem universal da Matemática, e compreensão
desses elementos é fundamental para a leitura de informações e análise de dados.

4 https://www.infoenem.com.br
http://mundoeducacao.bol.uol.com.br

27
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
A parte da Matemática que organiza e apresenta dados numéricos e a partir deles fornecer conclusões
é chamada de Estatística.

Tabelas: as informações nela são apresentadas em linhas e colunas, possibilitando uma melhor leitura
e interpretação. Exemplo:

Fonte: SEBRAE

Observação: nas tabelas e nos gráficos podemos notar que a um título e uma fonte. O título é utilizado
para evidenciar a principal informação apresentada, e a fonte identifica de onde os dados foram obtidos.

Tipos de Gráficos

Gráfico de linhas: são utilizados, em geral, para representar a variação de uma grandeza em certo
período de tempo.
Marcamos os pontos determinados pelos pares ordenados (classe, frequência) e os ligados por
segmentos de reta. Nesse tipo de gráfico, apenas os extremos dos segmentos de reta que compõem a
linha oferecem informações sobre o comportamento da amostra. Exemplo:

Gráfico de barras: também conhecido como gráficos de colunas, são utilizados, em geral, quando há
uma grande quantidade de dados. Para facilitar a leitura, em alguns casos, os dados numéricos podem
ser colocados acima das colunas correspondentes. Eles podem ser de dois tipos: barras verticais e
horizontais.

Gráfico de barras verticais: as frequências são indicadas em um eixo vertical. Marcamos os pontos
determinados pelos pares ordenados (classe, frequência) e os ligamos ao eixo das classes por meio de
barras verticais. Exemplo:

28
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Gráfico de barras horizontais: as frequências são indicadas em um eixo horizontal. Marcamos os
pontos determinados pelos pares ordenados (frequência, classe) e os ligamos ao eixo das classes por
meio de barras horizontais. Exemplo:

Observação: em um gráfico de colunas, cada barra deve ser proporcional à informação por ela
representada.

Gráfico de setores: são utilizados, em geral, para visualizar a relação entre as partes e o todo.
Dividimos um círculo em setores, com ângulos de medidas diretamente proporcionais às frequências
de classes. A medida α, em grau, do ângulo central que corresponde a uma classe de frequência F é
dada por:
360°
𝛼= .𝐹
𝐹𝑡
Onde:
Ft = frequência total

Exemplo

Para acharmos a frequência relativa, podemos fazer uma regra de três simples:
400 --- 100%
160 --- x
x = 160 .100/ 400 = 40%, e assim sucessivamente.

Aplicando a fórmula teremos:

360° 360°
−𝐹𝑢𝑡𝑒𝑏𝑜𝑙: 𝛼 = .𝐹 → 𝛼 = . 160 → 𝛼 = 144°
𝐹𝑡 400

360° 360°
−𝑉ô𝑙𝑒𝑖: 𝛼 = .𝐹 → 𝛼 = . 120 → 𝛼 = 108°
𝐹𝑡 400

360° 360°
−𝐵𝑎𝑠𝑞𝑢𝑒𝑡𝑒: 𝛼 = .𝐹 → 𝛼 = . 60 → 𝛼 = 54°
𝐹𝑡 400

360° 360°
−𝑁𝑎𝑡𝑎çã𝑜: 𝛼 = .𝐹 → 𝛼 = . 20 → 𝛼 = 18°
𝐹𝑡 400

29
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Como o gráfico é de setores, os dados percentuais serão distribuídos levando-se em conta a proporção
da área a ser representada relacionada aos valores das porcentagens. A área representativa no gráfico
será demarcada da seguinte maneira:

Com as informações, traçamos os ângulos da circunferência e assim montamos o gráfico:

Pictograma ou gráficos pictóricos: em alguns casos, certos gráficos, encontrados em jornais,

revistas e outros meios de comunicação, apresentam imagens relacionadas ao contexto. Eles são
desenhos ilustrativos. Exemplo:

Histograma: o consiste em retângulos contíguos com base nas faixas de valores da variável e com
área igual à frequência relativa da respectiva faixa. Desta forma, a altura de cada retângulo é denominada
densidade de frequência ou simplesmente densidade definida pelo quociente da área pela amplitude da
faixa. Alguns autores utilizam a frequência absoluta ou a porcentagem na construção do histograma, o
que pode ocasionar distorções (e, consequentemente, más interpretações) quando amplitudes diferentes
são utilizadas nas faixas. Exemplo:

30
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Polígono de Frequência: semelhante ao histograma, mas construído a partir dos pontos médios das
classes. Exemplo:

Gráfico de Ogiva: apresenta uma distribuição de frequências acumuladas, utiliza uma poligonal
ascendente utilizando os pontos extremos.

Cartograma: é uma representação sobre uma carta geográfica. Este gráfico é empregado quando o
objetivo é de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.

Interpretação de tabelas e gráficos

Para uma melhor interpretação de tabelas e gráficos devemos ter em mente algumas considerações:
- Observar primeiramente quais informações/dados estão presentes nos eixos vertical e horizontal,
para então fazer a leitura adequada do gráfico;
- Fazer a leitura isolada dos pontos.
- Leia com atenção o enunciado e esteja atento ao que pede o enunciado.

31
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Exemplos

(Enem) O termo agronegócio não se refere apenas à agricultura e à pecuária, pois as atividades
ligadas a essa produção incluem fornecedores de equipamentos, serviços para a zona rural,
industrialização e comercialização dos produtos.
O gráfico seguinte mostra a participação percentual do agronegócio no PIB brasileiro:

Centro de Estudos Avançados em Economia Aplicada (CEPEA).

Almanaque abril 2010. São Paulo: Abril, ano 36 (adaptado)
Esse gráfico foi usado em uma palestra na qual o orador ressaltou uma queda da participação do
agronegócio no PIB brasileiro e a posterior recuperação dessa participação, em termos percentuais.
Segundo o gráfico, o período de queda ocorreu entre os anos de
A) 1998 e 2001.
B) 2001 e 2003.
C) 2003 e 2006.
D) 2003 e 2007.
E) 2003 e 2008.

Resolução

Segundo o gráfico apresentado na questão, o período de queda da participação do agronegócio no

PIB brasileiro se deu no período entre 2003 e 2006. Esta informação é extraída através de leitura direta
do gráfico: em 2003 a participação era de 28,28%, caiu para 27,79% em 2004, 25,83% em 2005,
chegando a 23,92% em 2006 – depois deste período, a participação volta a aumentar.
Resposta: C

(Enem) O gráfico mostra a variação da extensão média de gelo marítimo, em milhões de quilômetros
quadrados, comparando dados dos anos 1995, 1998, 2000, 2005 e 2007. Os dados correspondem aos
meses de junho a setembro. O Ártico começa a recobrar o gelo quando termina o verão, em meados de
setembro. O gelo do mar atua como o sistema de resfriamento da Terra, refletindo quase toda a luz solar
de volta ao espaço. Águas de oceanos escuros, por sua vez, absorvem a luz solar e reforçam o
aquecimento do Ártico, ocasionando derretimento crescente do gelo.

Com base no gráfico e nas informações do texto, é possível inferir que houve maior aquecimento global
em
(A)1995.
(B)1998.
(C) 2000.
(D)2005.
(E)2007.

32
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Resolução

O enunciado nos traz uma informação bastante importante e interessante, sendo chave para a
resolução da questão. Ele associa a camada de gelo marítimo com a reflexão da luz solar e
consequentemente ao resfriamento da Terra. Logo, quanto menor for a extensão de gelo marítimo, menor
será o resfriamento e portanto maior será o aquecimento global.
O ano que, segundo o gráfico, apresenta a menor extensão de gelo marítimo, é 2007.

Resposta: E

Mais alguns exemplos:

01. Todos os objetos estão cheios de água.

Qual deles pode conter exatamente 1 litro de água?

(A) A caneca
(B) A jarra
(C) O garrafão
(D) O tambor
O caminho é identificar grandezas que fazem parte do dia a dia e conhecer unidades de medida, no
caso, o litro. Preste atenção na palavra exatamente, logo a resposta está na alternativa B.

02. No gráfico abaixo, encontra-se representada, em bilhões de reais, a arrecadação de impostos

federais no período de 2003 a 2006. Nesse período, a arrecadação anual de impostos federais:

(A) nunca ultrapassou os 400 bilhões de reais.

(B) sempre foi superior a 300 bilhões de reais.
(C) manteve-se constante nos quatro anos.
(D) foi maior em 2006 que nos outros anos.
(E) chegou a ser inferior a 200 bilhões de reais.
Analisando cada alternativa temos que a única resposta correta é a D.

33
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Questões

01. (Pref. Fortaleza/CE – Pedagogia – Pref. Fortaleza) “Estar alfabetizado, neste final de século,
supõe saber ler e interpretar dados apresentados de maneira organizada e construir representações, para
formular e resolver problemas que impliquem o recolhimento de dados e a análise de informações. Essa
característica da vida contemporânea traz ao currículo de Matemática uma demanda em abordar
elementos da estatística, da combinatória e da probabilidade, desde os ciclos iniciais” (BRASIL, 1997).
Observe os gráficos e analise as informações.

A partir das informações contidas nos gráficos, é correto afirmar que:

(A) nos dias 03 e 14 choveu a mesma quantidade em Fortaleza e Florianópolis.
(B) a quantidade de chuva acumulada no mês de março foi maior em Fortaleza.
(C) Fortaleza teve mais dias em que choveu do que Florianópolis.
(D) choveu a mesma quantidade em Fortaleza e Florianópolis.

02. (DEPEN – Agente Penitenciário Federal – CESPE)

Ministério da Justiça — Departamento Penitenciário Nacional

— Sistema Integrado de Informações Penitenciárias – InfoPen,
Relatório Estatístico Sintético do Sistema Prisional Brasileiro,
dez./2013 Internet:<www.justica.gov.br> (com adaptações)

34
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por
região em 2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de
vagas no sistema penitenciário e a quantidade de detentos no sistema penitenciário — registrado
em todo o Brasil foi superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil
habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Em 2013, mais de 55% da população carcerária no Brasil se encontrava na região Sudeste.
( )certo ( ) errado

03. (TJ/SP – Estatístico Judiciário – VUNESP) A distribuição de salários de uma empresa com
30 funcionários é dada na tabela seguinte.

Salário (em salários mínimos) Funcionários

1,8 10
2,5 8
3,0 5
5,0 4
8,0 2
15,0 1

Pode-se concluir que

(A) o total da folha de pagamentos é de 35,3 salários.
(B) 60% dos trabalhadores ganham mais ou igual a 3 salários.
(C) 10% dos trabalhadores ganham mais de 10 salários.
(D) 20% dos trabalhadores detêm mais de 40% da renda total.
(E) 60% dos trabalhadores detêm menos de 30% da renda total.

04. (TJ/SP – Estatístico Judiciário – VUNESP) Considere a tabela de distribuição de frequência

seguinte, em que xi é a variável estudada e fi é a frequência absoluta dos dados.

xi fi
30-35 4
35-40 12
40-45 10
45-50 8
50-55 6
TOTAL 40
Assinale a alternativa em que o histograma é o que melhor representa a distribuição de
frequência da tabela.

35
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
05. (SEJUS/ES – Agente Penitenciário – VUNESP) Observe os gráficos e analise as afirmações
I, II e III.

I. Em 2010, o aumento percentual de matrículas em cursos tecnológicos, comparado com 2001,

foi maior que 1000%.
II. Em 2010, houve 100,9 mil matrículas a mais em cursos tecnológicos que no ano anterior.
III. Em 2010, a razão entre a distribuição de matrículas no curso tecnológico presencial e à
distância foi de 2 para 5.
É correto o que se afirma em
(A) I e II, apenas.
(B) II, apenas.
(C) I, apenas.
(D) II e III, apenas.
(E) I, II e III.
06. (DEPEN – Agente Penitenciário Federal – CESPE)

A partir das informações e do gráfico apresentados, julgue o item que se segue.

Se os percentuais forem representados por barras verticais, conforme o gráfico a seguir, então
o resultado será denominado histograma.

( ) Certo ( ) Errado

36
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Comentários
01. Resposta: C.
A única alternativa que contém a informação correta com os gráficos é a C.
02. Resposta: CERTO.
555----100%
306----x
X=55,13%
03. Resposta: D.
(A) 1,8*10+2,5*8+3,0*5+5,0*4+8,0*2+15,0*1=104 salários
(B) 60% de 30, seriam 18 funcionários, portanto essa alternativa é errada, pois seriam 12.
(C)10% são 3 funcionários
(D) 40% de 104 seria 41,6
20% dos funcionários seriam 6, alternativa correta, pois5*3+8*2+15*1=46, que já é maior.
(E) 60% dos trabalhadores: 18
30% da renda: 31,20, errada pois detêm mais.
04. Resposta: A.
A menor deve ser a da primeira 30-35
Em seguida, a de 55
Depois de 45-50 na ordem 40-45 e 35-40
05. Resposta: E.
I- 69,8------100%
781,6----x
X=1119,77
II- 781,6-680,7=100,9
10 2
III- 25 = 5

06. Resposta: ERRADO.

Como foi visto na teoria, há uma faixa de valores no eixo x e não simplesmente um dado.

MEDIDAS DE POSIÇÃO – CENTRALIDADE

As medidas de posição visam localizar com maior facilidade onde está a maior concentração de valores
de uma dada distribuição, podendo estar ela no início, meio ou fim; e também se esta distribuição está
sendo feita de forma igual.
As medidas de posição mais importantes são as de tendência central (veremos aqui para dados
agrupados):
- Média;
- Moda;
- Mediana.

MÉDIA ARITMÉTICA (𝒙 ̅)
A média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles.
Anteriormente tratamos a média para dados não agrupados, agora veremos para dados agrupados.

1) Sem intervalo de classe: considerando a distribuição relativa a 34 famílias de quatro filhos, e

tomando como variável o número de filhos do sexo masculino, teremos a seguinte tabela:

Nº de meninos fi
0 2
1 6
2 10
3 12
4 4
∑ = 34

37
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
As frequências são números indicadores da intensidade de cada valor da variável, elas funcionam
como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada por:

𝚺𝒙𝒊 𝒇𝒊
̅=
𝒙
𝚺𝒇𝒊

O método mais prático de resolvermos é adicionarmos mais uma coluna para obtenção da média
ponderada:

Nº de meninos fi xi.fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
∑ = 34 ∑ = 78
Aplicando a fórmula temos:
Σ𝑥𝑖 𝑓𝑖 78
𝑥̅ = = = 2,29 → 𝑥̅ = 2,3 𝑚𝑒𝑛𝑖𝑛𝑜𝑠
Σ𝑓𝑖 34

Nota: quando a variável apresenta um valor 2 meninos, 3 décimos de meninos, como devemos
interpretar o resultado? Como o valor médio 2,3 meninos sugere (para este caso) que o maior número de
famílias tem 2 meninos e 2 meninas, sendo uma tendência geral, certa superioridade numérica em relação
ao número de meninos.

2) Com intervalos de classe: convencionamos que todos os valores incluídos em um determinado

intervalo de classe coincidam com seu ponto médio. Determinamos a média ponderada através da
fórmula:
Σ𝑥𝑖 𝑓𝑖
𝑥̅ = , 𝑜𝑛𝑑𝑒 𝑥𝑖 é 𝑜 𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒.
Σ𝑓𝑖

Exemplo:
i Estaturas (cm) fi
1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
∑ = 40

Vamos abrir uma coluna para os pontos médios e outra para os produtos:

i Estaturas (cm) fi xi xi.fi

1 150 ├ 154 4 152 608
2 154 ├ 158 9 156 1404
3 158 ├ 162 11 160 1760
4 162 ├ 166 8 164 1312
5 166 ├ 170 5 168 840
6 170 ├ 174 3 172 516
∑ = 40 ∑ = 6440

Σ𝑥𝑖 𝑓𝑖
∑xifi = 6440, ∑fi = 40 e 𝑥̅ = Σ𝑓𝑖

Aplicando:

38
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
6440
𝑥̅ = = 161 → 𝑥̅ = 161 𝑐𝑚
40

Vantagens e desvantagens da média

1. É uma medida de tendência central que, por uniformizar os valores de um conjunto de

dados, não representa bem os conjuntos que revelam tendências extremas.
2. Não necessariamente tem existência real, isto é, nem sempre é um valor que faça parte do
conjunto de dados, para bem representá-lo, embora pertença obrigatoriamente ao intervalo
entre o maior e o menor valor.
3. É facilmente calculada.
4. Serve para compararmos conjuntos semelhantes.

MODA (Mo)
A moda é o valor que aparece com maior frequência em uma série de valores. Podemos dizer é o
valor que “está na moda”.

- Para dados não agrupados: ela é facilmente reconhecida, pois observamos o valor que mais se
repete, como dito na definição.
Exemplo:
A série: 7,8,9,10,11, 11, 12, 13, 14 tem moda igual a 10.

Observações:
- Quando uma série não apresenta valor modal, ou seja, quando nenhum valor aparece com
frequência, dizemos que ela é AMODAL.
- Quando uma série tiver mais de um valor modal, dizemos que é BIMODAL (dois valores modas),
TRIMODAL, etc.

- Para dados agrupados

1) Sem intervalo de classe: para determinarmos a moda basta observamos a variável com maior
frequência. Vejamos o exemplo:

Nº de meninos fi
0 2
1 6
2 10
3 12
4 4
∑ = 34

Observamos que a maior frequência(fi) é 12, que corresponde ao valor de variável 3, logo: Mo = 3

2) Com intervalo de classe: a classe que apresenta maior frequência é denominada classe modal. A
moda é o valor dominante que está compreendido entre os limites da classe modal. O método mais
simples para o cálculo é tomar o ponto médio da classe modal. A este valor damos o nome de moda
bruta.
𝒍 ∗ +𝑳 ∗
𝑴𝒐 =
𝟐

Onde:
l* → limite inferior da classe modal
L* → limite superior da classe modal
Exemplo:

i Estaturas (cm) fi
1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11

39
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
∑ = 40

Observe que a classe com maior frequência é a de i = 3, nela temos que l* = 158 e o L* = 162, aplicando
na fórmula:

𝑙 ∗ +𝐿 ∗ 158 + 162 320

𝑀𝑜 = = = = 160, 𝑙𝑜𝑔𝑜 𝑎 𝑀𝑜 = 160𝑐𝑚
2 2 2

Existem ainda outros métodos mais elaborados para encontramos a moda, um deles seria a fórmula
de Czuber, onde:

𝑫𝟏
𝑴𝒐 = 𝒍 ∗ + .𝒉 ∗
𝑫𝟏 + 𝑫𝟐

Onde temos:
l*→ limite inferior da classe modal
h* → amplitude da classe modal
D1 → f* - f(ant)
D2 → f* - f(post)
f*→ frequência simples da classe modal
f(ant)→ frequência simples da classe anterior à classe modal
f(post) → frequência simples da classe posterior à classe modal.

Aplicando a fórmula ao exemplo anterior temos:

𝐷1 11 − 9 2
𝑀𝑜 = 𝑙 ∗ + . ℎ ∗= 158 + . (162 − 158) = 158 + .4
𝐷1 + 𝐷2 (11 − 9) + (11 − 8) 2+3

8
𝑀𝑜 = 158 + = 158 + 1,6 = 159,6 ≅ 160 𝑐𝑚
5

Gráficos da moda
Observe que a moda é o valor correspondente, no eixo das abcissas, ao ponto de ordenada máxima.
Assim temos:

40
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
A moda é utilizada:
- Quando desejamos obter uma medida rápida e aproximada de posição;
- Quando a medida de posição deve ser o valor mais típico da distribuição.

Vantagens e Desvantagens da Moda

1) Não depende de todos os valores da série, nem de sua ordenação, podendo mesmo não se alterar
com a modificação de alguns deles.
2) Não é influenciada por valores extremos (grandes) da série.
3) Sempre tem existência real, ou seja, sempre é representada por um elemento do conjunto de dados,
excetuando o caso de classes de frequências, quando trabalhamos com subconjuntos (dados
agrupados) e não com cada elemento isoladamente.

MEDIANA (Md)
Como o próprio nome sugere, a mediana é o valor que se encontra no centro de uma série de
números, estando estes dispostos segundo uma ordem. É o valor situado de tal forma no conjunto
que o separa em dois subconjuntos de mesmo número de elementos.

- Para dados não agrupados: para identificarmos a mediana, precisamos ordenar os dados
(crescente ou decrescente) dos valores, para depois identificarmos o valor central. Exemplo:
Dada a série de valores:
5, 13, 10, 2, 18, 15, 6, 16, 9, vamos ordenar os valores em ordem crescente:
2, 5, 6, 9, 10, 13, 15, 16,18; como temos uma sequência de 9 números precisamos identificar aquele
que divide o conjunto em 2 subconjuntos com a mesma quantidade de elementos. Neste caso o valor é
10, pois temos a mesma quantidade de elementos tanto a esquerda quanto a direita:

Md = 10
Neste caso como a série tem número ímpar de termos, ficou fácil identificarmos a mediana. Porém se
a série tiver número par, a mediana será, por definição, qualquer dos números compreendidos entre dois
valores centrais desta série, ao qual utilizaremos o ponto médio entre as duas. Exemplo:
2, 6, 7, 10, 12, 13, 18, 21 (8 termos), vamos utilizar os valores mais centrais que neste caso são o 4º
e o 5º termo. Então a mediana será:
10 + 12 22
𝑀𝑑 = = = 11
2 2
Observações: estando ordenado os valores de uma série e sendo n o número de elementos desta
série, o valor mediano será:
𝑛+1
- o termo de ordem , se n for ímpar;
2
𝑛 𝑛
- a média aritmética dos termos de ordem 2 𝑒 2 + 1, se n for par.
Observando os exemplos dados:
𝑛+1 9+1 10
- Para n = 9, temos = = = 5, a mediana é o 5º temo, que é Md = 10.
2 2 2
- Para n = 8, temos 8/2 = 4 e 8/2 + 1 = 4 + 1 = 5. Logo a mediana é a média aritmética do 4º e 5º termo:
10 + 12 / 2 = 22 / 2 = 11 → Md = 11

41
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Notas:
- O valor da mediana pode coincidir ou não com um elemento da série. Se for ímpar há
coincidência, se for par já não há;
- A mediana e a média aritmética não têm necessariamente, o mesmo valor;
- A mediana depende da posição dos elementos e não dos valores dos elementos na
série ordenada. Essa é uma diferença marcante entre mediana e a média;
- A mediana também pode ser chamada de valor mediano.

- Para dados agrupados: o cálculo da mediana se processa de modo semelhante ao dos dados não
agrupados, implicando na determinação prévia das frequências acumuladas.
1) Sem intervalo de classe: neste caso basta identificarmos a frequência acumulada imediatamente
superior à metade da soma da frequências. A mediana será o valor da variável que corresponde a tal
frequência acumulada. Exemplo:
Nº de meninos fi Fa
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
∑ = 34
Logo teremos:
Σfi 34
2
= 2 = 17, a menor frequência acumulada que supera este valor é 18, que corresponder ao valor 2
da variável, sendo esta a mediana ou valor mediano. Md = 2 meninos.

Nota:
Σfi
- Caso exista uma frequência acumulada (Fa ou Fi), tal que: 𝐹𝑖 = 2 , a mediana será dada por:
𝑥𝑖 + 𝑥𝑖+1
𝑀𝑑 =
2
Ou seja, a mediana será a média aritmética entre o valor da variável correspondente a essa frequência
acumulada e a seguinte. Exemplo:
xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
∑=8
Temos: 8/2 = 4 = F3
Então:
15 + 16 31
𝑀𝑑 = = = 15,5
2 2
1) Com intervalo de classe: precisamos, neste caso, determinar o ponto do intervalo em que está
compreendido a mediana. Para tal, precisamos determinar a classe mediana, que será aquela
Σfi
correspondente à frequência acumulada imediatamente superior a 2 . Fazendo isso podemos interpolar
os dados (inserção de uma quantidade de valores entre dois números), admitindo-se que os valores se
distribuam uniformemente em todo o intervalo de classe. Exemplo:

i Estaturas (cm) fi Fi
1 150 ├ 154 4 4
2 154 ├ 158 9 13
3 158 ├ 162 11 24
4 162 ├ 166 8 32
5 166 ├ 170 5 37
6 170 ├ 174 3 40
∑ = 40

42
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
A classe destaca é a classe mediana. Temos que:
Σfi 40
= = 20
2 2
Como há 24 valores incluídos nas três primeiras classes de distribuição e como pretendemos
determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar localizado
na terceira classe (i = 3), supondo que as frequências dessa classe estejam uniformemente distribuídas.
Como existe 11 elementos nesta classe (fi) e o intervalo da classe (i) é 4, devemos tomar, a partir do
limite inferior, a distância:
20 − 13 7 7 28
.4 = . 4, 𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑠𝑒𝑟á 𝑑𝑎𝑑𝑎 𝑝𝑜𝑟: 𝑀𝑑 = 158 + . 4 = 158 + = 158 + 2,54 = 160,5 𝑐𝑚
11 11 11 11
Em resumo aplicamos os seguintes passos:

1º - Determinamos as frequências acumuladas;

2º - Calculamos ∑fi / 2;
3º - Marcamos a classe corresponde à frequência acumulada imediatamente superior a ∑fi / 2 (classe
mediana) e após isso aplicamos a fórmula:
𝚺𝒇𝒊
[ − 𝑭(𝒂𝒏𝒕)] . 𝒉 ∗
𝟐
𝑴𝒅 = 𝒍 ∗ +
𝒇∗
Onde:
l* → limite inferior da classe mediana;
F (ant) → frequência acumulada da classe anterior à classe mediana;
f* → frequência simples da classe mediana;
h* → amplitude do intervalo da classe mediana.

Baseado no exemplo anterior temos:

l* = 158 ; F(ant) = 13 ; f* = 11 e h* = 4
Empregamos a mediana quando:
- Desejamos obter o ponto que divide a distribuição em partes iguais;
- Há valores extremos que afetam de uma maneira acentuada a média;
- A variável em estudo é salário.

Vantagens e Desvantagens da Mediana

1) Não depende de todos os valores do conjunto de dados, podendo mesmo não se alterar
com a modificação.
2) Não é influenciada por valores extremos (grandes) do conjunto de dados.
3) Quando há valores repetidos, a interpretação do valor mediano não é tão simples.

Posição relativa da Média, Mediana e Moda

Quando a distribuição é simétrica, as 3 medidas coincidem; porém a assimetria torna elas diferentes e
essa diferença é tanto maior quanto é a assimetria. Com isso teremos um distribuição em forma de sino:
x̅ = Md = Mo → curva simétrica

Mo < Md < x̅ → curva assimétrica positiva;

x̅ < Md < Mo → curva assimétrica negativa.

43
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Referência
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002

OUTLIERS

Os outliers são dados que se diferenciam drasticamente de todos os outros, são pontos fora da curva.
Em outras palavras, um outlier é um valor que foge da normalidade e que pode (e provavelmente irá)
causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise.
Entender os outliers é fundamental em uma análise de dados por pelo menos dois aspectos:
1. os outliers podem visar negativamente todo o resultado de uma análise;
2. o comportamento dos outliers pode ser justamente o que está sendo procurado.

Os outliers possuem diversos outros nomes, como: dados discrepantes, pontos fora da curva,
observações fora do comum, anomalias, valores atípicos, entre outros.
A seguir elencamos algumas situações comuns em que os outliers surgem na análise de dados e
apontamos sugestões de como lidar com eles em cada caso.

Como identificar quais são os dados outliers?

Encontrar os outliers utilizando tabelas
A forma mais simples de encontrar dados outliers é olhar diretamente para a tabela ou planilha de
dados – o dataset, como chamam os cientistas de dados.
O caso da tabela a seguir exemplifica claramente um erro de digitação, ou seja, de input dos dados. O
campo da idade do indivíduo Antônio Silveira certamente não representa a idade de 470 anos. Olhando
para a tabela é possível identificar o outlier, mas fica difícil afirmar qual seria a idade correta. Existem
várias possibilidades que podem se referir a idade certa, como: 47, 70 ou ainda 40 anos.

Em uma pequena amostra a tarefa de encontrar outliers com o uso de tabelas pode ser fácil. Porém,
quando a quantidade de observações passa para a casa dos milhares ou milhões fica impossível de
encontrar quais são os dados que destoam do geral. Essa tarefa fica ainda mais difícil quando muitas
variáveis (as colunas da planilha) são envolvidas.

44
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Questões
01. (TRT-8ª – Analista Judiciário – CESPE) Com relação à definição das medidas de tendência
central e de variabilidade dos dados em uma estatística, assinale a opção correta.
(A) A moda representa o centro da distribuição, é o valor que divide a amostra ao meio.
(B) A amplitude total, ou range, é uma medida de tendência central pouco afetada pelos valores
extremos.
(C) A mediana é o valor que ocorre mais vezes, frequentemente em grandes amostras.
(D) A variância da amostra representa uma medida de dispersão obtida pelo cálculo da raiz quadrada
positiva do valor do desvio padrão dessa amostra.
(E) A média aritmética representa o somatório de todas as observações dividido pelo número de
observações.
02. (Pref. Fortaleza/CE – Matemática – Pref. Fortaleza/CE) A medida estatística que separa as
metades superior e inferior dos dados amostrados de uma população é chamada de:
(A) mediana.
(B) média.
(C) bissetriz.
(D) moda.
03. (SSP/AM – Técnico de Nível Superior – FGV) A sequência a seguir mostra o número de gols
marcados pelo funcionário Ronaldão nos nove últimos jogos disputados pelo time da empresa onde ele
trabalha:
2, 3, 1, 3, 0, 2, 0, 3, 1.
Sobre a média, a mediana e a moda desses valores é verdade que:
(A) média < mediana < moda;
(B) média < moda < mediana;
(C) moda < média < mediana;
(D) mediana < moda < média;
(E) mediana < média < moda.
04. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática
– FUNCAB) Determine a mediana do conjunto de valores (10, 11, 12, 11, 9, 8, 10, 11, 10, 12).
(A) 8,5
(B) 9
(C) 10,5
(D) 11,5
(E) 10
05. (Pref. Guarujá/SP – SEDUC – Professor de Matemática – CAIPIMES) As massas de 5 amigos
são 63,5; 70,3; 82,2; 59 e 71,5 quilogramas. A média e a mediana das massas são, respectivamente:
(A) 69,3 e 70,3 quilogramas.
(B) 172,25 e 82,2 quilogramas.
(C) 69,3 e 82,2 quilogramas.
(D) 172, 70,3 quilogramas.
06. (FUNDUNESP – Auxiliar Administrativo – VUNESP) O gráfico apresenta informações sobre o
número médio de anos de estudo da população brasileira, com base na Pesquisa Nacional por Amostra
de Domicílios de 2011, publicado pelo Instituto Brasileiro de Geografia e Estatística (IBGE).

45
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Com base nas informações do gráfico, é verdade que
(A) o número de homens com estudo é menor que o número de mulheres com estudo, nos anos de
2009 e 2011.
(B) de 2009 para 2011 houve um aumento no número de homens com estudo.
(C) em 2010, a média de anos de estudo das mulheres era de 7,4 anos.
(D) em 2009, a média de anos de estudos das mulheres era de exatos 7 anos e 3 meses.
(E) a média de anos de estudo das mulheres não ultrapassou a 5 meses a dos homens, nos anos de
2009 e 2011.

07. (FUNDUNESP – Auxiliar Administrativo – VUNESP) Um concurso é composto por três fases,
com pesos 1, 2 e 3, respectivamente. Pedro ficou sabendo que na 1.ª fase desse concurso sua nota foi
7,0 e que na 2.ª fase sua nota foi 4,0.
Sabendo-se que para ser aprovado a média aritmética ponderada final tem que ser, no mínimo, 5, que
as notas apresentadas ainda não estão multiplicadas pelos respectivos fatores, e que em cada fase as
notas variam de zero a dez, pode-se afirmar corretamente que
(A) não há como Pedro ser aprovado no concurso.
(B) Pedro já está aprovado no concurso, independentemente da nota que tirar na 3.ª fase.
(C) se Pedro tirar 5,0 ou mais na 3.ª fase, então ele estará aprovado no concurso.
(D) Pedro precisa tirar, no mínimo, 7,0 na 3.ª fase, para ser aprovado no concurso.
(E) tirando 4,0, Pedro estará aprovado no concurso.

08. (IF/GO – Assistente de Alunos – UFG) A tabela a seguir apresenta o índice de desenvolvimento
humano (IDH) de alguns países da América Latina referente ao ano 2012.

Dentre os países listados, aquele cujo IDH representa a mediana dos dados apresentados é:
(A) Brasil
(B) Colômbia
(C) México
(D) Venezuela

09. (QC – Segundo Tenente – Ciências Contábeis – MB) Analise a tabela a seguir.
Classe Velocidade (em nós) Tempo(h)
1 0 |------- 5 1
2 5 |------ 10 7
3 10 |------ 15 15
4 15 |------ 20 9
5 20 |------ 25 3
6 25 |------ 30 2

Dos registros de navegação de um determinado navio, foi obtido o quadro acima.

Após análise dos registros, determine a média das velocidades do navio na série observada e assinale
a opção correta.
(A) 13,43 nós
(B) 13,92 nós
(C) 14,12 nós
(D) 14,69 nós
(E) 15,26 nós

46
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
10. (Pref. Paulistana/PI – Professor de Matemática – IMA) Considere o conjunto de dados abaixo,
referente ao salário médio dos funcionários de uma empresa.

O valor da Mediana é:
(A) 1240
(B) 1500
(C) 1360
(D) 1600
(E) 1420

Respostas

01.Resposta: E.
Pela definições apresentadas a única que responde de forma correta a questão é sobre a média.

02. Resposta: A.
Pela definição temos que esta medida é a Mediana.

03.Resposta: A.
Reordenando temos:
0,0,1,1,2,2,3,3,3
Fica evidente o valor da moda, Mo = 3
A mediana é o meio, como é uma sequência com 9 números temos: n+1/2 → 9 +1 / 2 → 10/2 → 5,
logo a mediana será o 5º termo, então Md = 2
A média é a somatória de todos os valores, dividido pela quantidade 1+1+2+2+3+3+3 = 15, 15/9 = 1,66
Logo: média < mediana < moda

04. Resposta: C.
Coloquemos os valores em ordem crescente:
8, 9, 10, 10, 10, 11, 11, 11, 12, 12

Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente,
temos que:
10 + 11 21
𝑀= = = 10,5
2 2
05. Resposta: A.
63,5+70,3+82,2 + 59+71,5 346,5
A média é: 𝑀 = 5
= 5 = 69,3
Para verificar a mediana, basta colocar os valores em ordem crescente e verificar o elemento que se
encontra no meio deles:
59 63,5 70,3 71,5 82,2

06. Resposta: E.
7,3+7,5 14,8
Média das mulheres: 2 = 2
= 7,4 anos = 7,4 . 12 = 88,8 meses

7+7,1 14,1
Média dos homens: 2 = 2 = 7,05 anos = 7,05 . 12 = 84,6 meses
Assim, 88,8 – 84,6 = 4,2 meses

47
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
07. Resposta: C.
Pesos 1, 2 e 3, respectivamente. Pedro ficou sabendo que na 1.ª fase desse concurso sua nota foi 7,0
e que na 2.ª fase sua nota foi 4,0.
Sabendo-se que para ser aprovado a média aritmética ponderada final tem que ser, no mínimo, 5

1.7 + 2.4 + 3. 𝑥
𝑀= =5
1+2+3
15 + 3. 𝑥
=5
6

15 + 3𝑥 = 6 . 5

3𝑥 = 30 − 15

15
𝑥= =5
3

08. Resposta: C.
Vamos colocar os números em ordem crescente:
0,645 0,719 0,730 0,758 0,775 0,780 0,792 0,811 0,819
O número que se encontra no meio é 0,775 (México).

09. Resposta: C.
Vamos calcular a média de cada classe:
* Classe 1: (0 + 5) / 2 = 5 / 2 = 2,5
2,5 . 1 = 2,5
* Classe 2: (5 + 10) / 2 = 15 / 2 = 7,5
7,5 . 7 = 52,5
* Classe 3: (10 + 15) / 2 = 25 / 2 = 12,5
12,5 . 15 = 187,5
* Classe 4: (15 + 20) / 2 = 35 / 2 = 17,5

17,5 . 9 = 157,5
* Classe 5: (20 + 25) / 2 = 45 / 2 = 22,5
22,5 . 3 = 67,5
* Classe 6: (25 + 30) / 2 = 55 / 2 = 27,5
27,5 . 2 = 55
* Soma das médias = 522,5
* Total de horas = 37h
Por final: 522,5 / 37 = 14,12

10. Resposta: C.
Colocando na ordem crescente:
1100;1200;1210;1250;1300;1420;1450;1500;1600;1980
A mediana é o número que se encontra no meio. Nesse caso que tem 10 números(par) é a média do
5º e 6º números:

1300 + 1420 2720

= = 1360
2 2

MEDIDAS DE POSIÇÃO: SEPARATRIZES

São números que dividem a sequência ordenada de dados em partes que contêm a mesma quantidade
de elementos da série.
Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada um deles contendo
50% dos valores da sequência, é também uma medida separatriz.
Além da mediana, as outras medidas separatrizes são: quartis, quintis, decis e percentis.

48
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Quartis
Nos quartis, a série é dividida em quatro partes iguais. Os elementos separatrizes da serie são Q1, Q2,
e Q3.

Q1: é o primeiro quartil, corresponde à separação dos primeiros 25% de elementos da serie.
Q2: é o segundo quartil, coincide com a mediana (Q2 = Md).
Q3: é o terceiro quartil, corresponde à separação dos últimos 25% de elementos da série, ou seja, os
75% dos elementos da série.

Para o cálculo dos quartis utilizam-se técnicas semelhantes àquelas do cálculo da mediana.
Consequentemente, podem-se utilizar as mesmas fórmulas do calculo da mediana, levando em conta
que onde houver a expressão  f i será substituída por K  f i , sendo K o número da ordem do quartil,
2 4
em que K =1 corresponde ao primeiro quartil; K = 2 corresponde ao segundo quartil e K = 3 ao terceiro
quartil.

Cálculo do quartil para o rol

1° Passo: Determina-se a posição do Quartil.
Kn
PQK = (onde K = 1,2ou 3)
4
2° Passo: Identifica-se a posição mais próxima do rol.
3° Passo: Verifica-se quem está naquela posição.

Exemplo: Calcule Q1, Q2 e Q3 para o seguinte conjunto de valores:

A = {4,1,8,0,11,10,7,8,6,2,9,12}
Inicialmente precisamos colocar os valores em ordem (rol)
A = {0,1,2,4,6,7,8,8,9,10,11,12}

a) Vamos utilizar os passos para o cálculo do 1° quartil:

1° Passo: Determina-se a posição do 1° quartil:
1  12
PQ1 = = 3  posição do 1 quartil
4
2° Passo: Identificar a posição 3
3° Passo: Procura-se no rol o valor do número que está na posição identificada.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12

0 1 2 4 6 7 8 8 9 10 11 12

O número que corresponde a 25% do rol é o valor 2

b) Vamos utilizar os passos para o cálculo do 2° quartil:

1° Passo: Determina-se a posição do 2° quartil:

2° Passo: Identificar a posição 6

3° Passo: Procura-se no rol o valor do número que está na posição identificada.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12

0 1 2 4 6 7 8 8 9 10 11 12

O número que corresponde a 50% do rol é o valor 7

49
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
c) Vamos utilizar os passos para o cálculo do 3° quartil:
1° Passo: Determina-se a posição do 3° quartil:

2° Passo: Identificar a posição 9

3° Passo: Procura-se no rol o valor do número que está na posição identificada.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12

0 1 2 4 6 7 8 8 9 10 11 12

Quintis
Ao dividir a série ordenada em cinco partes, cada uma ficará com seus 20% de seus elementos.
Os elementos que separam estes grupos são chamados de quintis.
Assim, o primeiro quintil, indicado por K1, separa a sequência ordenada deixando 20% de seus valores
à esquerda e 80% de seus valores à direita.
De modo análogo são definidos os outros quintis.
Decis
Ao dividir a série ordenada em dez partes, cada uma ficará com seus 10% de seus elementos.
Os elementos que separam estes grupos são chamados de decis.
Assim, o primeiro decil, indicado por D1, separa a sequência ordenada deixando 10% de seus valores
à esquerda e 90% de seus valores à direita.
De modo análogo são definidos os outros decis.
Os decis dividem a distribuição em dez partes iguais. A fórmula é semelhante à que vimos
anteriormente:
i.n
a) Calcula-se onde i = 1,2,3,4,5,6,7,8,9
10
b) Identifica-se a classe do decil (Di) pela freqüência acumulada.
 i.n 
 − f .h
Di = l Di +  
10
c) Aplica-se a fórmula
FDi
onde,

l Di = limite inferior da classe do decil

n = quantidade de elementos da amostra
f = frequência acumulada da classe anterior à classe do decil
h = amplitude da classe do decil
FDi = Frequência da classe do decil

Exemplo:
Estaturas(cm) fi Fi
150 ├ 154 4 4
154 ├ 158 9 13
158 ├ 162 11 24
162 ├ 166 8 32
166 ├ 170 5 37
170 ├ 174 3 40
 = 40

Se quiséssemos calcular o 4º e 8º Decis, faríamos:

 4.40 
 − 13.4
D4 = 158 +   = 159,09
i.n 4.40 10
Para o 4º Decil: = = 16
10 10 11

50
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
 8.40 
 − 24 .4
D8 = 162 +   = 166
i.n 8.40 10
Para o 8º Decil = = 32
10 10 8

Percentis
Ao dividir a série ordenada em cem partes, cada uma ficará com 1% de seus elementos.
Os elementos que separam estes grupos são chamados de centis ou percentis.
Assim, o primeiro percentil, indicado por P1, separa a sequência ordenada deixando 1% de seus
valores à esquerda e 99% de seus valores à direita.
De modo análogo são definidos os outros percentis.
São as medidas que dividem a amostra em 100 partes iguais. O cálculo é semelhante aos anteriores:
i.n
a) Calcula-se , onde i = 1,2,3,...,99
100
b) Identifica-se a classe do percentil (Pi) pela freqüência acumulada.
 i.n 
 − f .h
c) Aplica-se a fórmula Pi = l Pi +  100 
FPi
Exemplo:
Seja a tabela abaixo, obtida da amostra sobre salários em um determinado bairro de uma cidade.

fi Fi
Sal.Mínimo(SM)
4 ├ 9 8 8
9 ├ 14 12 20
14 ├ 19 17 37
19 ├ 24 3 40
 = 40

Quais o 4º decil e o 72º percentil?

i.n 4.40
4º Decil. : = = 16 A classe do 4º Decil é a de freqüência igual a 12
10 10

 4.40 
 − 8 .5
D4 = 9 +   = 12,33
10
12
72º Percentil : .
i.n 72 .40
= = 28,8 P72 = 14 +
(28,8 − 20 ).5 = 16,59
100 100 17

Conclusão: Nessa distribuição temos que o valor de 12,33 SM divide a amostra em duas partes: 40%
(4º decil) estão abaixo dele e 60% estão acima. Temos também que 16,59 SM divide a amostra em duas
partes: 72% (P72) estão abaixo dele e 28% estão acima.

Cálculo da separatriz:
Identifica-se a medida que se pretende obter com o percentil correspondente, Pi.
Calcula-se i% de n para localizar a posição do percentil i no Rol, ou seja:

51
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Em seguida, identifica-se o elemento que ocupa esta posição.
Note que se o elemento for um número inteiro, então o Pi procurado é um dos elementos da sequência
ordenada.
Se não for um número inteiro, isto significa que Pi é um elemento intermediário entre os elementos que
ocupam as posições aproximadas por falta ou por excesso do valor calculado. Neste caso, Pi é definido
como sendo a média dos valores que ocupam estas posições aproximadas.

Questões

01. A tabela apresenta uma distribuição hipotética. Não há observações coincidentes com os limites
das classes.

A melhor estimativa para o terceiro quartil da distribuição é, aproximadamente, de

(A)34,75
(B)34,9
(C)35
(D)35,75
(E)35,9

02. Um teste de raciocínio abstrato foi aplicado a 816 alunos de uma escola de 1° grau, dando
os seguintes resultados:

a) Qual é o máximo de pontos que classifica um aluno entre os 25% mais fracos?

b) Qual é o mínimo de pontos necessários para um aluno se classificar entre os 25% mais fortes?

c) Qual é o máximo de pontos que ainda classifica um aluno entre os 10% mais fracos?

d) Qual é o mínimo de pontos para que um aluno esteja entre os 10% mais fortes?

e) Qual é o máximo de pontos que ainda classifica o aluno entre os 1% mais fracos?

f) Qual é o mínimo de pontos para que um aluno esteja entre os 5% mais fortes?

52
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Respostas.

01. Resposta: E.
3 Quartil = L1 + ((3*N/4 - Som. freq. anteriores)/Frequência quartil) * amplitude do intervalo
3 quartil = 30 + ((3*164/4 - 64)/100) * 10
3 Quartil = 35,90

02. Resposta:
a)

53
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
MEDIDAS DE DISPERSÃO

As medidas de tendência central fornecem informações valiosas mas, em geral, não são suficientes
para descrever e discriminar diferentes conjuntos de dados. As medidas de Dispersão ou variabilidade
permitem visualizar a maneira como os dados espalham-se (ou concentram-se) em torno do valor central.
Para mensurarmos está variabilidade podemos utilizar as seguintes estatísticas: amplitude total; distância
interquartílica; desvio médio; variância; desvio padrão e coeficiente de variação.

- Amplitude Total: é a diferença entre o maior e o menor valor do conjunto de dados.

Ex.: dados: 3, 4, 7, 8 e 8. Amplitude total = 8 – 3 = 5

- Distância Interquartílica: é a diferença entre o terceiro e o primeiro quartil de um conjunto de dados.

O primeiro quartil é o valor que deixa um quarto dos valores abaixo e três quartos acima dele. O terceiro
quartil é o valor que deixa três quartos dos dados abaixo e um quarto acima dele. O segundo quartil é a
mediana. (O primeiro e o terceiro quartis fazem o mesmo que a mediana para as duas metades
demarcadas pela mediana.) Ex.: quando se discutir o boxplot.

- Desvio Médio: é a diferença entre o valor observado e a medida de tendência central do conjunto
de dados.

- Variância: é uma medida que expressa um desvio quadrático médio do conjunto de dados, e sua
unidade é o quadrado da unidade dos dados.

- Desvio Padrão: é raiz quadrada da variância e sua unidade de medida é a mesma que a do conjunto
de dados.

- Coeficiente de variação: é uma medida de variabilidade relativa, definida como a razão percentual
entre o desvio padrão e a média, e assim sendo uma medida adimensional expressa em percentual.

Boxplot: Tanto a média como o desvio padrão podem não ser medidas adequadas para representar
um conjunto de valores, uma vez que são afetados, de forma exagerada, por valores extremos. Além
disso, apenas com estas duas medidas não temos ideia da assimetria da distribuição dos valores. Para
solucionar esses problemas, podemos utilizar o Boxplot. Para construí-lo, desenhamos uma "caixa" com
o nível superior dado pelo terceiro quartil (Q3) e o nível inferior pelo primeiro quartil (Q1). A mediana (Q2)
é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os
valores máximo e mínimo, que não sejam observações discrepantes. O critério para decidir se uma
observação é discrepante pode variar; por ora, chamaremos de discrepante os valores maiores do que
Q3+1.5*(Q3-Q1) ou menores do que Q1-1.5*(Q3-Q1).
O Boxplot fornece informações sobre posição, dispersão, assimetria, caudas e valores discrepantes.

O Diagrama de dispersão é adequado para descrever o comportamento conjunto de duas variáveis

quantitativas. Cada ponto do gráfico representa um par de valores observados. Exemplo:

Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da

variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.
Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se define a
principal medida de dispersão - a variância, apresentada a seguir.

54
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Variância: Define-se a variância, como sendo a medida que se obtém somando os quadrados dos
desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações
da amostra menos um.

Desvio-Padrão: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime
não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão: O
desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será
a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são: o desvio padrão será maior, quanta mais variabilidade houver entre os dados.

Exemplo: Em uma turma de aluno, verificou-se através da análise das notas de 15 alunos, os seguintes
desempenhos:
Conceito
Alunos na
Prova
1 4,3
2 4,5
3 9
4 6
5 8
6 6,7
7 7,5
8 10
9 7,5
10 6,3
11 8
12 5,5
13 9,7
14 9,3
15 7,5
Total 109,8
Média 7,32
Desvio
1,77
Padrão

Observamos no exemplo, que a média das provas, foi estimada em 7,32 com desvio padrão em 1,77.
Concluímos que a maioria das notas concentrou-se em 9,09 e 5,55.

Vejamos de outra forma:

Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da

variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.

55
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Repare-se nas duas amostras seguintes, que embora tenham a mesma média, têm uma dispersão bem
diferente:

Como a medida de localização mais utilizada é a média, será relativamente a ela que se define a
principal medida de dispersão - a variância, apresentada a seguir.
Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os
quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número
de observações da amostra menos um:

Se afinal pretendemos medir a dispersão relativamente à média. Por que é que não somamos
simplesmente os desvios em vez de somarmos os seus quadrados?
Experimenta calcular essa soma e verás que (x1-x) + (x2-x) + (x1-x) + ... + (xn – x) ≠ 0. Poderíamos ter
utilizado módulos, para evitar que os desvios negativos, mas é mais fácil trabalhar com quadrados, não
concorda?! E por que é que em vez de dividirmos pó “n”, que é o número de desvios, dividimos por (n-
1)? Na realidade, só aparentemente é que temos “n” desvios independentes, isto é, se calcularmos (n-1)
desvios, o restante fica automaticamente calculado, uma vez que a sua soma é igual a zero. Costuma-se
referir este fato dizendo que se perdeu um grau de liberdade.
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma
que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades
que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:

O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior
será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são:
- o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre
os dados.
- se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.

Exemplo: Na 2ª classe de certa escola o professor deu uma tarefa constituída por um certo número
de contas para os alunos resolverem. Pretendendo determinar a dispersão dos tempos de cálculo,
observam-se 10 alunos durante a realização da tarefa, tendo-se obtido os seguintes valores:

Tempo
Aluno
(minutos)
i
xi
1 13 - 3.9 15.21
2 15 - 1.9 3.61
3 14 - 2.9 8.41
4 18 1.1 1.21
5 25 8.1 65.61
6 14 - 2.9 8.41
7 16 -0.9 0.81
8 17 0.1 0.01
9 20 3.1 9.61
10 17 0.1 0.01
169 0.0 112.90

56
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Resolução: Na tabela anterior juntamos duas colunas auxiliares, uma para colocar os desvios das
observações em relação à média e a outra para escrever os quadrados destes desvios. A partir da coluna
das observações calculamos a soma dessas observações, que nos permitiu calcular a média = 16.9.
Uma vez calculada a média foi possível calcular a coluna dos desvios. Repare-se que, como seria de
esperar, a soma dos desvios é igual a zero. A soma dos quadrados dos desvios permite-nos calcular a
variância donde s = 3.54.
112.9
s2 = = 12.54
9

O tempo médio de realização da tarefa foi de aproximadamente 17 minutos com uma variabilidade
medida pelo desvio padrão de aproximadamente 3.5 minutos. Na representação gráfica ao lado
visualizamos os desvios das observações relativamente à média (valores do exemplo anterior):

Do mesmo modo que a média, também o desvio padrão é uma medida pouco resistente, pois é
influenciado por valores ou muito grandes ou muito pequenos (o que seria de esperar já que na sua
definição entra a média que é não resistente). Assim, se a distribuição dos dados for bastante enviesada,
não é conveniente utilizar a média como medida de localização, nem o desvio padrão como medida de
variabilidade. Estas medidas só dão informação útil, respectivamente sobre a localização do centro da
distribuição dos dados e sobre a variabilidade, se as distribuições dos dados forem aproximadamente
simétricas.
Propriedades para dados com distribuição aproximadamente normal: Uma propriedade que se verifica
se os dados se distribuem de forma aproximadamente normal, ou seja, quando o histograma apresenta
uma forma característica com uma classe média predominante e as outras classes se distribuem à volta
desta de forma aproximadamente simétrica e com frequências a decrescer à medida que se afastam da
classe média, é a seguinte:
Aproximadamente 68% dos dados estão no intervalo .

Desvio Padrão: Propriedades para dados com distribuição aproximadamente normal:

- Aproximadamente 68% dos dados estão no intervalo

- Aproximadamente 95% dos dados estão no intervalo
- Aproximadamente 100% dos dados estão no intervalo

Como se depreende do que atrás foi dito, se os dados se distribuem de forma aproximadamente
normal, então estão praticamente todos concentrados num intervalo de amplitude igual a 6 vezes o desvio
padrão.

57
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
A informação que o desvio padrão dá sobre a variabilidade deve ser entendida como a variabilidade
que é apresentada relativamente a um ponto de referência - a média, e não propriamente a variabilidade
dos dados, uns relativamente aos outros.
A partir da definição de variância, pode-se deduzir sem dificuldade uma expressão mais simples, sob
o ponto de vista computacional, para calcular ou a variância ou o desvio padrão e que é a seguinte:

É a medida de variabilidade que em geral é expressa em porcentagem, e tem por função determinar o
grau de concentração dos dados em torno da média, geralmente utilizada para se fazer a comparação
entre dois conjuntos de dados em termos percentuais, esta comparação revelará o quanto os dados estão
próximos ou distantes da média do conjunto de dados.

Exemplo
Considere a tabela abaixo que contém as estaturas e os pesos de um mesmo grupo de indivíduos:

Média Desvio-padrão
Estaturas 175 cm 5 cm
Pesos 68 kg 2 kg
Pergunta: Qual das medidas (Estatura ou Peso) possui maior homogeneidade?

Como não é possível responder a essa pergunta utilizando o desvio-padrão, pois é uma medida de
dispersão absoluta, teremos que calcular o CVP da Estatura e o CVP do Peso. A série que apresentar a
menor variação, ou seja, o menor valor do coeficiente CVP, será a série de maior homogeneidade.
Seguindo a fórmula do coeficiente CVP, temos:

58
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
CVP Estatura

CVP Peso

Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.

Amplitude: Uma medida de dispersão que se utiliza por vezes, é a amplitude amostral r, definida como
sendo a diferença entre a maior e a menor das observações: r = xn:n - x1:n, onde representamos por x1:n e
xn:n, respectivamente o menor e o maior valor da amostra (x1, x2, ..., xn), de acordo com a notação
introduzida anteriormente, para a amostra ordenada.

Amplitude Inter-Quartil: A medida anterior tem a grande desvantagem de ser muito sensível à
existência, na amostra, de uma observação muito grande ou muito pequena. Assim, define-se uma outra
medida, a amplitude inter-quartil, que é, em certa medida, uma solução de compromisso, pois não é
afetada, de um modo geral, pela existência de um número pequeno de observações demasiado grandes
ou demasiado pequenas. Esta medida é definida como sendo a diferença entre os 1º e 3º quartis.
Amplitude inter-quartil = Q3/4 - Q1/4
Do modo como se define a amplitude inter-quartil, concluímos que 50% dos elementos do meio da
amostra, estão contidos num intervalo com aquela amplitude. Esta medida é não negativa e será tanto
maior quanto maior for a variabilidade nos dados. Mas, ao contrário do que acontece com o desvio padrão,
uma amplitude inter-quartil nula, não significa necessariamente, que os dados não apresentem
variabilidade.

Amplitude inter-quartil ou desvio padrão: Do mesmo modo que a questão foi posta relativamente
às duas medidas de localização mais utilizadas - média e mediana, também aqui se pode por o problema
de comparar aquelas duas medidas de dispersão.
- A amplitude inter-quartil é mais robusta, relativamente à presença de "outliers", do que o desvio
padrão, que é mais sensível aos dados.
- Para uma distribuição dos dados aproximadamente normal, verifica-se a seguinte relação. Amplitude
inter-quartil 1.3 x desvio padrão.
- Se a distribuição é enviesada, já não se pode estabelecer uma relação análoga à anterior, mas pode
acontecer que o desvio padrão seja muito superior à amplitude inter-quartil, sobretudo se se verificar a
existência de "outliers".
Questões

01. (AL/GO – Assistente Legislativo – Assistente Administrativo – CS/UFG) Em estatística, a

variância é um número que apresenta a unidade elevada ao quadrado em relação a variável que
não está elevada ao quadrado, o que pode ser um inconveniente para a interpretação do resultado.
Por isso, é mais comumente utilizada na estatística descritiva o desvio-padrão, que é definido como
(A) a raiz quadrada da mediana, representada por "s" ou "μ".
(B) a raiz quadrada da variância, representada por "s" ou "α".
(C) a raiz quadrada da variância, representada por "s" ou "α".
(D) a raiz quadrada da média, representada por "s" ou "α".

02. (ANAC – Analista Administrativo – ESAF) Os valores a seguir representam uma amostra
331546248
Então, a variância dessa amostra é igual a
(A) 4,0
(B) 2,5
(C) 4,5
(D) 5,5
(E) 3,0

59
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
03. (MPE/AP – Analista Ministerial – FCC) Ao considerar uma curva de distribuição normal, com
uma média como medida central, temos a variância e o desvio padrão referentes a esta média. Em
relação a estes parâmetros,

(A) a variância é uma medida cujo significado é a metade do desvio padrão.

(B) a variância é calculada com base no dobro do desvio padrão.
(C) o desvio padrão é a raiz quadrada da variância.
(D) a média dividida pelo desvio padrão forma a variância.
(E) a variância elevada ao quadrado indica qual é o desvio padrão.

04. (MEC – Agente Administrativo – CESPE) Os dados abaixo correspondem às quantidades

diárias de merendas escolares demandadas em 10 diferentes escolas:

200, 250, 300, 250, 250, 200, 150, 200, 150, 200.

Com base nessas informações, julgue os próximos itens.

O desvio padrão amostral dos números diários de merendas escolares é superior a 50.
( ) Certo ( ) Errado

Respostas

01. Resposta: C.
Como visto, o desvio padrão é a raiz quadrada da variância.

02. Resposta: C.
Tem-se que a amostra contém as seguintes observações: 3 3 1 5 4 6 2 4 8. Para chegar à variância,
nessa questão, encontramos primeiro o valor da média.
A média desses valores é dada por: soma das observações/nº de observações menos 1. Logo,
3+3+1+5+4+6+2+4+8/ 9 = 4
Após isso, aplicamos a construção: (3-4)²+(3-4)²+(1-4)²+(5-4)²+(4-4)²+(6-4)²+(2-4)²+(4-4)²+(8-4)²/9-1
Calculando: [(-1)²+(-1)²+(-3)²+(1)²+(0)²+(2)²+(-2)²+(0)²+(4)²]/9-1
(1+1+9+1+0+4+4+0+16)/8
36/8 = 4,5

03. Resposta: C.
Conforme visto anteriormente, desvio padrão é a raiz quadrada da variância.

04. Resposta: Errado.

O desvio padrão amostral é dado por:
√∑(Xi – X média)²/(n − 1)
Onde n é o número de elementos (n=10), Xi representa cada elemento da amostra e X a média da
amostra. A média, neste caso, é:
Média (X) = ∑(Xi)/ n = (150 + 150 + 200 + 200 + 200 +200 + 250 + 250 + 250 + 300) /10 = 215
O Desvio Padrão será:
√∑(Xi – X média)²/(n − 1) =
√2 ∗ (150 − 215)² + 4 ∗ (200 − 215)² + 3 ∗ (250 − 215)² + 1 ∗ (300 − 215)² / (10 − 1) =
√8450 + 900 + 3675 + 7225/9 =
√2250
√2500= 50
Logo: √2250< 50

DISPERSÃO RELATIVA

Mede a relação entre a dispersão absoluta e o valor médio da série, com resultado expresso em
porcentagens.

60
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Tem grande aplicação, visto que possibilita comparar dispersão de universos diferentes (em unidade
de medida e/ou valor médio), já que seus resultados são expressos em percentagens devido à relação
entre as medidas de dispersão absoluta e de tendência central. São medidas usadas para análises
comparativas.
Coeficiente de variação de PEARSON - é a relação percentual entre o desvio padrão e a média aritmética.

Coeficiente de Variação de THORUDIKE:

ASSIMETRIA

É o grau de desvio ou afastamento da simetria de uma distribuição.

Quando a curva é simétrica, a média, a mediana e a moda coincidem, num mesmo ponto, de ordenada
máxima, havendo um perfeito equilíbrio na distribuição. Quando o equilíbrio não acontece, isto é, a média,
a mediana e a moda recaem em pontos diferentes da distribuição esta será assimétrica; enviesada a
direita ou esquerda.

Distribuição assimétrica Negativa ou enviesada a esquerda – quando os valores se concentram na

extremidade superior da escala e se distribuem gradativamente em direção à extremidade inferior.
Distribuição assimétrica Positiva ou enviesada a direita quando os valores se concentram na
extremidade inferior da escala e se distribuem gradativamente em direção à extremidade superior.

61
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Será Positivo a medida que o terceiro quartil se afasta da mediana, enquanto que o primeiro quartil
se aproxima da mesma, tendo como limite: Q1 = Q2, quando a assimetria assume o valor máximo positivo:
(S = 1).

Será Negativo a medida que o primeiro quartil afasta-se da mediana, enquanto o terceiro quartil
aproxima-se da mesma, dando como limite: Q3 = Q2, quando a assimetria assume valor máximo negativo:

Critério de Kelley - Para corrigir parte do inconveniente de se desprezar 50% das ocorrências (Critério
de Bowley), Kelley aconselha o uso dos “Centis” equidistantes da mediana, tais como C10 e C90, para
cálculo da assimetria.

Coeficiente de Assimetria de Pearson – Á medida que a distribuição deixa de ser simétrica, a média,
a mediana e a moda vão se afastando, aumentando cada vez mais a diferença entre elas.

CURTOSE

É o grau de achatamento de uma distribuição, em relação a distribuição normal. A curtose pode ser de
três tipos:

Mesocúrtica - quando a distribuição é normal.

Leptocúrtica - quando a distribuição é mais pontiaguda que a normal
Platicúrtica - quando a distribuição é mais achatada que a normal.

62
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
MEDIDAS DE CURTOSE

Coeficiente Percentílico de Curtose:

Se C = 0,263 a distribuição é Mesocúrtica

Se C < 0,263 a distribuição é Leptocúrtica
Se C > 0,263 a distribuição é Platicúrtica

Exemplo

1. Determinar a variância das amostras constituída dos seguintes elementos.

xi = 7; 10; 12; 15; 16; 18; 20 e yi = 12; 15; 18; 23; 25; 26; 28.

s2 = 16 e s = 4 s2 = 36,6667 ⇒ s = 6,06

2. Calcular a variância da questão 1.06

2 Probabilidade. 2.1 Definições básicas e axiomas. 2.2 Probabilidade condicional

e independência. 2.3 Variáveis aleatórias discretas e contínuas. 2.4 Distribuição
de probabilidades. 2.5 Função de probabilidade. 2.6 Função densidade de
probabilidade. 2.7 Esperança e momentos. 2.8 Distribuições especiais. 2.9
Distribuições condicionais e independência. 2.10 Transformação de variáveis.
2.11 Leis dos grandes números. 2.12 Teorema central do limite. 2.13 Amostras
aleatórias. 2.14 Distribuições amostrais.

Caro(a) Candidato(a) todo o assunto pertinente a Probabilidade já foi abordado na matéria de

“Raciocínio Lógico”, dessa forma, abordaremos o assunto restante.

VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS

Função de distribuição acumulada de uma variável aleatória discreta

A partir da função de distribuição de probabilidades de uma v.a. discreta X é possível calcular a

probabilidade de qualquer evento associado a ela. Por exemplo, para a fdp da figura 1.5, temos que

63
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Então, podemos dizer que a fdp de uma variável aleatória discreta X nos dá toda a informação sobre
X. Existe uma outra função com tal característica, que é a função de distribuição acumulada de X, cuja
definição apresentamos a seguir.

Definição 1 Dada uma variável aleatória (discreta) X, a função de distribuição acumulada de X é

definida por

É interessante notar que a função FX está definida para todo número real x. Antes de passar às
propriedades teóricas da função de distribuição acumulada (usaremos a abreviação fda), também
conhecida como função de distribuição, vamos ver um exemplo.

Exemplo

Voltando ao exemplo 1 anterior, temos que a fdp da v.a. X = “máximo das faces de 2 dados” é dada
por

Para calcular a fda de X, notemos inicialmente que nenhum valor menor que 1 é possível. Logo,

Para x =1 devemos notar que

Para qualquer valor de x tal que 1 < x < 2, temos que pX(x)= 0. Logo,

Juntando os resultados (1.5) e (1.6), obtemos que

Com raciocínio análogo, obtemos que

e também que

ou seja,

64
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Continuando obtemos que

Para x ≥ 6 devemos notar que o evento {X ≤ x} corresponde ao espaço amostral completo; logo

FDA da v.a. X do exercício 1

(b) A fda é

Funções de variáveis aleatórias

Dada uma v.a. X, podemos obter outras variáveis aleatórias através de funções de X e, da mesma
forma que calculamos a fdp de X, podemos calcular a fdp dessas novas variáveis.

Exemplo

Considere a v.a. X cuja fdp é dada na tabela abaixo:

x -2 -1 0 1 2 3
pX 0,1 0,2 0,2 0,3 0,1 0,
(x) 1

65
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Consideremos a função Y = g(X) = X2. Então, Y é uma nova variável aleatória, cujos possíveis valores
são 0, 1, 4, 9. Para calcular as probabilidades desses valores, temos que identificar os valores de X que
originaram cada um deles. Temos a seguinte equivalência de eventos:

Como os eventos são mutuamente exclusivos, segue que

e podemos resumir essa fdp como

y 0 1 4 9
pY (y) 0,2 0,5 0,2 0,1

Em geral, temos o seguinte resultado:

Seja X uma variável aleatória discreta com função de distribuição de probabilidade p X (x) . Se definimos
uma nova v.a. Y = g(X), onde g é uma função real qualquer, então a fdp de Y é calculada como

Exemplos
1. Considere o problema do pôquer. Suponha que um jogador paga R$100,00 para entrar no jogo.
Se ele tirar uma sequência, ele ganha R$200,00; se tirar 5 iguais, ganha R$5.100,00; se tirar 4 iguais,
ganha R$100,00. Em todos os outros casos, ele perde. Seja L o lucro do jogador. Encontre a fdp de L.

Solução:
De acordo com o exercício citado, temos a seguinte equivalência de eventos:

Para calcular as probabilidades, temos que lembrar que A 8 ⊂ A1. Logo, se denotarmos por A∗1 o
eventos “todas diferentes mas não em seqüência”, temos que Pr (A∗1 ) = Pr(A1) − Pr(A8) =

66
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Considere a v.a. X cuja fdp é

Encontre o valor de p e a fda da v.a. Y = X 2.

Solução:

Como Pr (Ω) = 1, temos que ter p = Os valores possíveis de Y são 1, 9, 25

Logo, a fda de Y é

Esperança e variância de variáveis aleatórias discretas

No estudo da Estatística Descritiva, vimos como sumarizar conjuntos de dados através de distribuições
de frequências e também por estatísticas-resumo, como a média e a variância, no caso de variáveis
quantitativas. Em particular, vimos que a média de dados agrupados em classes era calculada como uma
média ponderada dos valores centrais (valores representativos das classes), com a ponderação definida
pelas frequências relativas das classes.
No estudo de variáveis aleatórias e suas distribuições de probabilidades, estamos associando números
aos pontos do espaço amostral, ou seja, o resultado é sempre uma variável quantitativa (note que os
resultados cara e coroa não definem uma variável aleatória; para tal, temos que associar números, 0 e 1
por exemplo, a esses resultados). Sendo assim, podemos fazer perguntas do tipo “qual o valor médio da
variável aleatória X?”, “qual a dispersão dos valores de X?”, da mesma forma que fizemos na análise
descritiva de dados. O ponto chave para a compreensão das definições que serão apresentadas é o
estabelecimento da analogia com o estudo das distribuições de frequências feito na parte inicial do curso.
Tal analogia se faz através da interpretação frequencial do conceito de probabilidade.

Probabilidade e frequência relativa

Consideremos novamente o experimento aleatório “lançamento de um dado”, mas agora um dado que
sabemos não ser equilibrado. Como poderíamos proceder para calcular a probabilidade de cada face?
Uma resposta, talvez intuitiva, seria lançar esse dado um grande número de vezes e observar o número
de ocorrências de cada face. As frequências relativas nos dariam, então, o que poderíamos pensar como
sendo a probabilidade de cada evento simples (face). É de se esperar que, quanto maior o número de
repetições do experimento (lançamento do dado), mais próximas das “verdadeiras” probabilidades
estariam essas frequências relativas. Esta é, assim, a definição de probabilidade de um evento através
da freqüência relativa:

onde o número de repetições do experimento deve ser grande.

67
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Ao trabalharmos com variáveis aleatórias, podemos pensar também nas probabilidades dos diferentes
valores da variável como sendo frequências relativas em um número sempre crescente de repetições do
experimento, ou seja, podemos pensar as probabilidades como sendo limites das frequências relativas.
Dessa forma, definiremos medidas de posição e dispersão para distribuições de probabilidades de
variáveis aleatórias de maneira análoga à utilizada em distribuições de frequências.

Esperança ou média de uma variável aleatória discreta Seja X uma variável aleatória discreta que
assume os valores x1, x2, . . . com probabilidades p 1, p2, . . . respectivamente. A média ou esperança de
X é definida como

onde o somatório se estende por todos os valores possíveis de X. Podemos ver, então, que a esperança
de X é uma média dos seus valores, ponderada pelas respectivas probabilidades. Lembre-se que no caso
das distribuições de frequências tínhamos . Como antes, a média de uma v.a. X está medida na
mesma unidade da variável.

Exemplo
Em determinado setor de uma loja de departamentos, o número de produtos vendidos em um dia pelos
funcionários é uma variável aleatória P com a seguinte distribuição de probabilidades (esses números
foram obtidos dos resultados de vários anos de estudo):

Cada vendedor recebe comissões de venda, distribuídas da seguinte forma: se ele vende até 2
produtos em um dia, ele ganha uma comissão de R$10,00 por produto vendido. A partir da terceira venda,
a comissão passa para R$50,00. Qual é o número médio de produtos vendidos por cada vendedor e qual
a comissão média de cada um deles?

Solução:
O número médio de vendas por funcionário é

E(P) = 0 × 0,1 + 1 × 0,4 + 2 × 0,2 + 3 × 0,1 + 4 × 0,1 + 5 × 0, 05 + 6 × 0, 05 = 2, 05

Com relação à comissão, vamos construir sua fdp:

e
E(C) = 0 × 0,1 + 10 × 0,4 + 20 × 0,2 + 70 × 0, 1 + 120 × 0, 1 + 170 × 0, 05 + 220 × 0, 05 = 46, 5
ou seja, a comissão média por dia de cada vendedor é R$46,50.

Em geral, a média é vista como um “valor representativo” de X, estando localizada em algum ponto no
“centro do domínio de valores de X”. Uma interpretação mais precisa deste pensamento é a seguinte: a
esperança de X é o centro de gravidade da distribuição de probabilidades, no seguinte sentido. Pensando
as colunas do gráfico, que representam as probabilidades, como pesos distribuídos ao longo de uma vara
delgada, a média representa o ponto onde a vara se equilibraria.

68
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Interpretação da média como centro de gravidade da distribuição

Esperança de funções de variáveis aleatórias

Vimos que é possível obter novas variáveis aleatórias a partir de funções g(X) de uma variável X e
através da fdp de X podemos obter a fdp de Y. Sendo assim, podemos calcular a esperança de Y. Foi
exatamente isso o que fizemos no caso das comissões no exemplo 1.7, onde tínhamos C = 2P + 50 × (3
− P). Analisando atentamente aquele exemplo e notando que, por definição de função, a cada valor de X
corresponde um único Y = g(X), obtemos o resultado geral sobre a esperança de funções de variáveis
aleatórias.

Seja X uma variável aleatória discreta com função de distribuição de probabilidade pX (x) . Se definimos
uma nova v.a. Y = g(X), então

Propriedades da esperança
A interpretação da esperança como centro de gravidade nos permite entender melhor as diversas
propriedades que demonstraremos a seguir. No que segue, X é uma variável aleatória discreta com
distribuição de probabilidades pX(x) e a, b 0 são constantes reais quaisquer.

1. E (a) = a
De fato: se X é uma v.a. constante, isso significa que X = a com probabilidade 1. Logo, E(X) = a ×1 =
a.

2. E (X + a) = E(X) + a (“somando uma constante, a média fica somada da constante”)

De fato: fazendo g(X) = X + a, pelo resultado 1.11, temos que

3. E(bX) = bE(X) (“multiplicando por uma constante, a esperança fica multiplicada pela constante”)
De fato: fazendo g(X) = bX, pelo resultado 1.11, temos que

69
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
4. E(a + bX) = a + bE(X)
Esse resultado é conseqüência direta dos resultados anteriores.

5. xmin ≤ E(X) ≤ xmax onde xmin e xmax são os valores mínimo e máximo da variável X.
De fato: temos que xi ≥ xmin e xi ≤ xmax ∀i. Então

Variância de uma variável aleatória

A esperança de uma variável aleatória X é uma medida de posição. No entanto, é possível que duas
variáveis bem diferentes tenham a mesma esperança, como é o caso das duas distribuições
apresentadas na figura.

Distribuições com mesma esperança e diferentes dispersões

Como já visto no caso da Estatística Descritiva, é necessário mensurar outros aspectos da distribuição,
entre eles a dispersão dos dados. Esta será medida através da distância quadrática de cada valor à média
da distribuição; mais precisamente, definimos a variância de uma variável aleatória X como

V ar (X) = E [X − E (X)]2

Definindo g(X) = [X − E(X)]2, temos, pelo resultado, que

Mas, se definimos h(X) = X2, então Logo, podemos escrever

que pode ser lida de maneira mais fácil como “a variância é a esperança do quadrado menos o
quadrado da esperança”. Lembre-se que tínhamos visto resultado análogo para a variância de um
conjunto de dados. Vimos também que a unidade de medida da variância é igual ao quadrado da unidade
da variável.

70
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Propriedades da variância
Sendo uma medida de dispersão, é fácil ver as seguintes propriedades: seja X uma v.a. discreta com fdp
pX(x) e sejam a, b 0 constantes reais quaisquer.

1. Var (a) = 0 (“uma constante não tem dispersão”)

De fato:

Note que aqui usamos uma propriedade da esperança.

2. Var (X + a) = Var(X) (“somando uma constante, a dispersão - variância - não se altera”)

De fato:

Var (X + a) = E [X + a − E (X + a)]2 = E [X + a − E (X) − a]2 = E [X − E (X)]2 = Var (X)

Note que aqui usamos a propriedade 2 da esperança.

3. Var (bX) = b2 Var (X) (“multiplicando por uma constante não nula, a variância fica multiplicada pelo
quadrado da constante”)
De fato:

Note que aqui usamos a propriedade 2 da esperança.

3. Var (bX) = b2 Var (X) (“multiplicando por uma constante não nula, a variância fica multiplicada pelo
quadrado da constante”)
De fato:

Note que aqui usamos a propriedade 3 da esperança.

4. Var (a + bX) = b2 Var (X)

Essa propriedade é consequência direta das propriedades anteriores.

Desvio padrão
Como já dito, a unidade de medida da variância é o quadrado da unidade de medida da variável em
estudo, sendo assim, uma unidade sem significado físico. Para se ter uma medida de dispersão na mesma
unidade dos dados, define-se o desvio padrão como a raiz quadrada da variância.

Como consequência direta dessa definição e das propriedades da variância, seguem as seguintes
propriedades do desvio padrão, que deverão ser demonstradas pelo leitor. Como antes, seja X uma v.a.
discreta com fdp pX(x) e sejam a, b 0 constantes reais quaisquer.

1. DP (a) = 0 (uma constante não tem dispersão)

2. DP (X + a) = DP (X)
3. DP (bX) = |b| DP (X)
Aqui vale notar que √b2 = |b|.
4. DP (a + bX) = |b| DP (X).

71
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Exemplo
Um lojista mantém extensos registros das vendas diárias de um certo aparelho. O quadro a seguir dá
a distribuição de probabilidades do número de aparelhos vendidos em uma semana. Se é de R$500,00 o
lucro por unidade vendida, qual o lucro esperado em uma semana? Qual é o desvio padrão do lucro?

Solução:
Seja X o número de aparelhos vendidos em uma semana e seja L o lucro semanal. Então, L = 500X.

Com relação ao lucro semanal, temos que

Consideremos o lançamento de dois dados equilibrados. Como já visto, o espaço amostral desse
experimento é formado pelos pares ordenados (i, j) onde i, j = 1, 2, 3, 4, 5, 6. Esse é um experimento
onde o espaço amostral não é formado por números. Suponhamos que nosso interesse esteja no máximo
das faces dos dois dados. Nesse caso, podemos associar um número a cada ponto do espaço amostral,
conforme ilustrado na figura 1.

Esse exemplo ilustra o conceito de variável aleatória.

Definição 1: Uma variável aleatória é uma função real (isto é, que assume valores em R) definida no
espaço amostral Ω de um experimento aleatório.

Por essa definição, podemos ver que, no lançamento de uma moeda, observar o resultado obtido, cara
ou coroa, não é uma variável aleatória, pois os resultados não são números. Mas se associarmos o
número 0 à ocorrência de cara e o número 1 à ocorrência de coroa, teremos uma variável aleatória.
Analogamente, em uma pesquisa domiciliar, o espaço amostral é formado pelos domicílios de uma
determinada localidade e simplesmente anotarmos os domicílios sorteados para uma amostra não
constitui uma variável aleatória. Mas, na prática, quando da realização de uma pesquisa domiciliar,
estamos interessados em alguma característica desse domicílio e aí poderemos ter várias variáveis
aleatórias associadas a esse experimento, como, por exemplo, a renda domiciliar mensal em reais,
Figura 1: Variável aleatória: máximo de 2 dados

72
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
o número de moradores, o grau de instrução do chefe de família medido pelo número de anos de
estudo, etc.

Definição 2: Uma variável aleatória é discreta se sua imagem (ou conjunto de valores que ela pode
tomar) é um conjunto finito ou enumerável. Se a imagem é um conjunto não enumerável dizemos que a
variável aleatória é contínua.

Exemplos
1. Dentre os 5 alunos de um curso com coeficiente de rendimento (CR) superior 8,5, dois serão
sorteados para receber uma bolsa de estudos. Os CRs desses alunos são: 8,8; 9,2; 8,9; 9,5;
9,0.

(a) Designando por A, B, C, D e E os alunos, defina um espaço amostral para esse experimento.
(b) Seja X = CR médio dos alunos sorteados. Liste os possíveis valores de X.
(c) Liste o evento X ≥ 9, 0.

Respostas

(a) Note que aqui a ordem não importa; logo, #Ω = (52) = 10. Mais especificamente,
Ω = {(A, B) , (A, C) , (A, D) , (A, E) , (B, C) , (B, D) , (B, E) , (C, D) , (C, E) , (D, E)}

(b) Usando uma tabela de duas entradas podemos representar os valores de X da seguinte
forma:

(c) {X ≥ 9} = {(A, B) , (A, D) , (B, C) , (B, D) , (B, E) , (C, D) , (D, E)} .

2. Um homem possui 4 chaves em seu bolso. Como está escuro, ele não consegue ver qual a chave
correta para abrir a porta de sua casa. Ele testa cada uma das chaves até encontrar a correta.
(a) Defina um espaço amostral para esse experimento.
(b) Defina a v.a. X = número de chaves experimentadas até conseguir abrir a porta (inclusive
a chave correta). Quais são os valores de X?

Respostas
(a) Vamos designar por C a chave da porta e por E1, E2 e E3 as outras chaves. Se ele para de testar
as chaves depois que acha a chave correta, então o espaço amostral é:
Ω ={ E1C, E2C, E3C, E1E2C, E2E1C, E1E3C, E3E1C, E2E3C, E3E2C, E1E2E3C, E1E3E2C,
E2E1E3C, E2E3E1C, E3E1E2C, E3E2E1C}

(b) X = 1, 2, 3, 4

Questões

01. Cinco cartas são extraídas de um baralho comum (52 cartas, 13 de cada naipe) sem reposição.
A v.a. X = número de cartas vermelhas sorteadas. Quais são os possíveis valores de X?
(A) os possíveis valores de X são 0,1,2,3,4,5,6,7,8,9,10,11,12,13.
(B) os possíveis valores de X são 0,1,2,3,4,5
(C) os possíveis valores de X são 1,2,3,4,5
(D) os possíveis valores de X são 1,2,3,4,5,6,7,8,9,10,11,12,13.

73
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
02. Numa urna há 7 bolas brancas e 4 bolas verdes. Cinco bolas são extraídas dessa urna. Defina a
v.a. X = número de bolas verdes. Quais são os possíveis valores de X se as extrações são feitas sem
reposição:
(A) os valores de X são 0, 1, 2, 3, 4
(B) os valores de X são 1, 2, 3, 4
(C) os valores de X são 0, 1, 2, 3, 4, 5, 6, 7.
(D) os valores de X são 1, 2, 3, 4, 5, 6, 7.

Comentários

01. Resposta: B.
No baralho há 26 cartas vermelhas, 13 de ouros e 13 de copas. Logo, os possíveis valores de
X são 0,1,2,3,4,5.

02. Resposta: A.
Como há apenas 4 verdes, os valores de X são 0, 1, 2, 3, 4. Note que temos bolas brancas em
quantidade suficiente para que X = 0 (isto é, podemos tirar todas brancas).

Função de distribuição de probabilidade

Os valores de uma v.a. discreta são definidos a partir do espaço amostral de um experimento aleatório.
Sendo assim, é natural perguntarmos “qual é a probabilidade do valor x”? No exemplo do máximo das 2
faces de um dado da figura 1, por exemplo, o valor 6 da v.a. é imagem de 11 pontos do espaço amostral,
enquanto o valor 2 é imagem de apenas 3 pontos. Sendo assim, é de se esperar que o valor 6 seja mais
provável que o valor 2. Na verdade, temos a seguinte equivalência de eventos: se chamamos de X a v.a.
“máximo dos 2 dados”, então

e, assim

Como os eventos no lado direito da expressão acima são mutuamente exclusivos e igualmente
prováveis, resulta que

De maneira análoga obtemos que

Definição 3: Seja X uma v.a. discreta. A função de distribuição de probabilidades de X é a função pX

(x) que associa, a cada valor possível x de X, sua respectiva probabilidade, calculada da seguinte forma:
pX (x) é a probabilidade do evento {X = x} consistindo de todos os resultados do espaço amostral que
deram origem ao valor x.

74
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Figura 2: Função de distribuição de probabilidade de uma v.a. discreta

Para não sobrecarregar o texto, omitiremos os colchetes oriundos da notação de evento/conjunto e

escreveremos Pr (X = x) no lugar de Pr ({X = x}), que seria a forma correta. Uma outra convenção que
seguiremos também será a de indicar por letras maiúsculas as variáveis aleatórias e por letras minúsculas
os números reais, tais como os valores específicos de uma v.a. Além disso, abreviaremos por fdp o termo
função de distribuição de probabilidade.
Das propriedades (axiomas) da probabilidade resultam os seguintes fatos sobre a função de
distribuição de probabilidades de uma v.a. X:

Onde indica somatório ao longo de todos os possíveis valores de X. Note que essa propriedade é
decorrente do axioma Pr (Ω) = 1, pois os eventos {X = x} são mutuamente exclusivos e formam uma
partição do espaço amostral.

Cálculo da função de distribuição de probabilidade

Considerando novamente a v.a. definida na figura 1, podemos resumir a fdp da variável em questão
na seguinte tabela:

Considere uma urna com 10 bolas, das quais 6 são vermelhas e 4 brancas. Dessa urna retiram-se 3
bolas sem reposição e conta-se o número de bolas brancas retiradas. Qual é a distribuição dessa variável
aleatória?

Os possíveis valores de X são 0,1,2,3. Para calcular a probabilidade de cada um desses valores,
devemos notar inicialmente que o espaço amostral tem (10 3
) eventos elementares.
O evento {X = 0} corresponde à união dos eventos (sequências) onde não aparece nenhuma bola
branca ou, equivalentemente, onde todas as bolas são vermelhas; ¡ o número de tais sequências
é (63) (40) = (63) . (Note que aqui estamos usando o princípio fundamental da multiplicação.) Logo,

75
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Analogamente, o evento {X = 1} corresponde à união dos eventos onde aparece 1 bola branca e 2
vermelhas. O número de tais sequências é (62) (41) e, portanto

Analogamente, obtemos que

e a fdp de X é

Distribuição de Bernoulli

Definição
Considere o lançamento de uma moeda. A característica desse experimento aleatório é que ele possui
apenas dois resultados possíveis. Uma situação análoga surge quando da extração da carta de um
baralho, onde o interesse está apenas na cor (preta ou vermelha) da carta sorteada.
Um experimento de Bernoulli é um experimento aleatório com apenas dois resultados possíveis; por
convenção, um deles é chamado “sucesso” e o outro “fracasso”.
A distribuição de Bernoulli é a distribuição de uma v.a. X associada a um experimento de Bernoulli,
onde se define X = 1 se ocorre sucesso e X = 0 se ocorre fracasso. Chamando de p a probabilidade de
sucesso (0 < p < 1), a distribuição de Bernoulli é:

Obviamente, as condições definidoras de uma fdp são satisfeitas, uma vez que p > 0, 1 − p > 0 e
p+(1−p) = 1. O valor de p é o único valor que precisamos conhecer para determinar completamente a
distribuição; ele é, então, chamado parâmetro da distribuição de Bernoulli. Vamos denotar a distribuição
de Bernoulli com parâmetro p por Bern(p).
A função de distribuição acumulada é dada por:

76
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Temos os gráficos da fdp e da fda de uma distribuição de Bernoulli.
Distribuição de Bernoulli com parâmetro p

Esperança
Seja X ∼ Bern(p) (lê-se: a variável aleatória X tem distribuição de Bernoulli com parâmetro p).
Então, E(X) = 0 × (1 − p) + 1 × p. Logo,

X ∼ Bern(p) ⇒ E(X) = p

Variância
Seja X ∼ Bern(p). Então,

E(X2) = 02 × (1 − p) + 12 × p ⇒ E(X2) = p ⇒ V ar(X) = p − p2

Logo,
X ∼ Bern(p) ⇒ V ar(X) = p(1 − p)

Distribuição Geométrica

Definição
Considere a situação descrita no exercício 3 do capítulo 1: uma moeda com probabilidade p de cara é
lançada até que apareça cara pela primeira vez. Como visto, tal experimento gera uma v.a. discreta X =
“número de repetições necessárias até a ocorrência da primeira cara” com infinitos valores. Essa é uma
situação onde é impossível encontrar algum paralelo na prática; no entanto, o “infinito” na prática, em
geral, é substituído por um “valor muito grande”. Considere uma população muito grande onde p% das
pessoas sofrem de uma doença desconhecida. Precisa-se encontrar uma pessoa portadora da doença
para que os médicos possam estudá-la. Quantas pessoas teremos que examinar até encontrar uma
portadora? Em ambas as situações, cada repetição do experimento (lançamento da moeda ou exame de
uma pessoa) tem dois resultados possíveis (cara ou coroa e Portadora ou não protadora da doença), ou
seja, temos experimentos de Bernoulli.
Consideremos repetições independentes de um experimento de Bernoulli com parâmetro p. Vamos
definir a seguinte v.a. associada a esse experimento aleatório:

X = número de repetições necessárias para a obtenção do primeiro sucesso

Os valores possíveis de X são 1 (primeiro sucesso na primeira repetição), 2 (primeiro sucesso na

segunda repetição e, portanto fracasso na primeira), 3 (primeiro sucesso na terceira repetição e, portanto,
fracasso nas duas primeiras), etc. Esse é um exemplo de v.a. discreta onde o espaço amostral,
enumerável, é infinito.
Para calcular a probabilidade de X = k, k = 1, 2, 3, . . . , devemos notar que tal evento corresponde à
ocorrência de fracassos nas k − 1 primeiras repetições e sucesso na k-ésima repetição.
Denotando por Fi e Si a ocorrência de fracasso e sucesso na i-ésima repetição respectivamente, temos
a seguinte equivalência de eventos:

77
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Como as repetições são independentes, segue que

ou seja,

Dizemos que X tem distribuição geométrica com parâmetro p (o único valor necessário para especificar
completamente a fdp) e vamos representar tal fato por X ∼ Geom(p).
As características definidoras desse modelo são: (i) repetições de um mesmo experimento de
Bernoulli, o que significa que em todas elas a probabilidade de sucesso (e, portanto, de fracasso) é a
mesma e (ii) as repetições são independentes. No caso do lançamento de uma moeda essas hipóteses
são bastante plausíveis mas no caso da doença a hipótese de independência pode não ser satisfeita; por
exemplo, pode haver um componente de hereditariedade.
Para mostrar que (2.5) realmente define uma fdp, temos que mostrar que a soma das probabilidades,
isto é, a probabilidade do espaço amostral é 1 (obviamente, Pr(X = k) ≥ 0). Para isso vamos usar o
seguinte resultado sobre séries geométricas:

Temos que:

Fazendo j = k − 1, temos que k = 1 ⇒ j = 0 e k = ∞ ⇒ j = ∞. Portanto,

Usando, obtém-se que:

Esperança

Fazendo a mudança de variável k −1 = j, resulta que k = j +1, k = 1 ⇒ j = 0 e k = ∞ ⇒ j = ∞. Logo,

Usando o resultado da seção 2.8 com r = 1− p, obtemos que:

78
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Logo,

Variância
Para calcular a variância, temos que calcular E(X 2). Por definição,

No primeiro somatório, a parcela correspondente a k = 1 é nula, logo, podemos escrever (note o índice
do somatório!):

1
O segundo somatório é a esperança da distribuição geométrica com parâmetro p; logo, ele é igual a 𝑝.
Fazendo a mudança de variável k −2 = j no primeiro somatório, resulta que

Usando os resultados (2.39) da seção 2.8 com r = 1− p, obtemos que:

Segue que:

Logo,

Exemplo
1. Um atirador acerta na mosca do alvo, 20% dos tiros. Qual a probabilidade de ele acertar na mosca
pela primeira vez no 10o tiro?
Solução:

Podemos pensar os tiros como experimentos independentes de Bernoulli (acerta ou não acerta). A
probabilidade de sucesso (acertar no alvo) é p = 0, 20. Estamos querendo o número de tiros até o primeiro
acerto e calcular a probabilidade desse número ser 10. Seja X = número de tiros até primeiro acerto.
Então, X ∼ Geom(0, 20) e Pr (X = 10) = 0, 89×0,2 = 0, 02684.

79
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Distribuição Binomial

Definição
Consideremos n repetições independentes de um experimento de Bernoulli com parâmetro p (pense
em n lançamentos de uma moeda com probabilidade p de cara). Vamos definir a seguinte v.a. associada
a este experimento:

X = número de sucessos obtidos nas n repetições

Lembre-se que você encontrou esta situação no exercício 5 do capítulo 1. Os valores possíveis de X
são 0 (só ocorrem fracassos), 1 (ocorre apenas 1 sucesso), 2 (ocorrem 2 sucessos), . . . , n (ocorrem
apenas sucessos). Vamos calcular a probabilidade de X = k, onde k = 0, 1, 2, . . . , n. O evento X = k
equivale à ocorrência de k sucessos e n − k fracassos. Consideremos uma situação específica: as k
primeiras repetições são “sucesso”. Como as repetições são independentes, temos a probabilidade da
interseção de eventos independentes; logo,

Mas essa é uma ordenação específica, onde os sucessos são os primeiros resultados. Na verdade, os k
sucessos podem estar em qualquer posição e ainda teremos X = k. O número de maneiras possíveis de
obter k sucessos em n repetições nada mais é que o número de combinações de n elementos tomados k
a k, ou seja, Como cada uma dessas maneiras tem a mesma probabilidade acima e elas são eventos
mutuamente exclusivos, resulta que

onde o número de parcelas é . Logo

Essa é a distribuição binomial; note que para determiná-la precisamos conhecer os valores de n e p,
que são os parâmetros da distribuição. Vamos usar a seguinte notação: X ∼ bin (n; p).
Note que na distribuição binomial, o número de lançamentos é fixo e o número de sucessos é a variável
de interesse; note o contraste com a distribuição binomial negativa onde o número de lançamentos é
variável e o número de sucessos é um número fixo (pré-determinado).
Para mostrar que realmente define uma fdp falta mostrar que

já que, obviamente, Pr(X = k) ≥ 0. De fato: o teorema do binômio de Newton nos diz que, se x e y são
números reais e n é um inteiro positivo, então

80
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Fazendo x = p e y = 1− p em (2.19), obtém-se:

o que prova o resultado.

Esperança

Quando k = 0, a parcela correspondente no somatório é nula. Logo, podemos escrever (note o índice
do somatório!):

e como k = 0, podemos fazer a divisão, o que resulta na simplificação

Fazendo j = k − 1, temos que k = j + 1, k = 1 ⇒ j = 0 e k = n ⇒ j = n − 1. Logo,

Mas nesse somatório temos as probabilidades de uma distribuição binomial com parâmetros (n −1) e
p; como estamos somando as probabilidades de todos os pontos do espaço amostral, segue que esse
somatório é igual a 1 (note que essa é a expressão do binômio de Newton para (x+y) n−1 com x = p e y =
1− p) e, portanto,

81
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Variância
Vamos calcular E (X2) . Usando raciocínio análogo ao usado no cálculo da esperança, temos que:

Mas o primeiro somatório é a esperança de uma binomial com parâmetros (n − 1) e p; portanto, pelo
resultado (2.20), é igual a (n − 1) p. Já o segundo somatório é a soma das probabilidades dos valores de
uma binomial com esses mesmos parâmetros (ou binômio de Newton); logo, é igual a 1.
Segue, então, que

e, portanto,

ou seja,

Exemplos

1. Um atirador acerta na mosca do alvo, 20% dos tiros. Se ele dá 10 tiros, qual a probabilidade de ele
acertar na mosca no máximo 1 vez?
Solução:

Podemos pensar os tiros como experimentos de Bernoulli independentes, onde a probabilidade de

sucesso é 0,20. Então, o problema pede Pr(X ≤ 1), onde X = número de acertos em 10 tiros. Logo, X ∼
bin(10; 0, 20) e

82
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Distribuição binomial versus distribuição hipergeométrica

Vamos fazer agora algumas comparações entre as distribuições binomial e hipergeométrica.

Colocando ambas em termos de extrações de bolas verdes de uma urna com bolas verdes e brancas, a
binomial equivale a extrações independentes com reposição. Note que, repondo as bolas, a probabilidade
de sucesso (isto é, bola verde) permanece constante ao longo das extrações. Já a hipergeométrica
corresponde a extrações sem reposição.

A esperança da binomial é igual ao produto do tamanho da amostra pela probabilidade de sucesso; em

termos da urna, a probabilidade de sucesso é e, portanto, a esperança é n

Na hipergeométrica, a esperança também é o produto do tamanho da amostra pela probabilidade de
sucesso, probabilidade essa tomada apenas na primeira extração.
A variância da binomial é igual ao produto do tamanho da amostra pelas probabilidades de sucesso e
fracasso. Em termos de urna, essas probabilidades são Na hipergeométrica, considerando
apenas a primeira extração, a variância é igual a esse produto, mas corrigido pelo fator
Em pesquisas estatísticas por amostragem, normalmente lidamos com amostragem sem reposição (já
imaginou visitar e entrevistar um mesmo morador duas vezes?). No entanto, os resultados teóricos sobre
amostragem com reposição são bem mais simples, assim, costuma-se usar uma aproximação, sempre
que possível. Ou seja, quando a população (tamanho N) é suficientemente grande (de modo que podemos
encará-la como uma população infinita) e o tamanho da amostra é relativamente pequeno, podemos
“ignorar” o fato de as extrações serem feitas sem reposição. Lembre-se que a probabilidade em extrações
sucessivas são Então, se N é “grande” e n é pequeno, temos que N ≈ N − 1 ≈ · · · ≈ N
− n. Nessas condições, extrações com e sem reposição podem ser consideradas como equivalentes. O
termo que aparece na variância da hipergeométrica, é chamado correção para populações finitas,
exatamente porque, se a população é pequena, não podemos ignorar o fato de as extrações estarem
sendo feitas sem reposição.

Exemplo
1. Um caçador, após um dia de caça, verificou que matou 5 andorinhas e 2 aves de uma espécie rara,
proibida de ser caçada. Como todos os espécimes tinham o mesmo tamanho, ele os colocou na mesma
bolsa, pensando em dificultar o trabalho dos fiscais. No posto de fiscalização há dois fiscais, Manoel e
Pedro, que adotam diferentes métodos de inspeção. Manoel retira três espécimes de cada bolsa dos
caçadores. Pedro retira um espécime, classifica-o e o repõe na bolsa, retirando em seguida um segundo
espécime. Em qualquer caso, o caçador é multado se é encontrado pelo menos um espécime proibido.
Qual dos dois fiscais é mais favorável para o caçador em questão?

Solução:
Seja X = número de aves proibidas (sucessos) encontradas por um fiscal. No caso de Manoel, temos que
X ∼ hiper(7; 2; 3) e no caso do fiscal Pedro, X ∼ bin

Logo, a probabilidade de multa é maior no caso do fiscal Manoel, e, portanto, Pedro é o fiscal mais
favorável para o caçador.

A distribuição de Poisson

Aproximação da binomial pela Poisson

Suponhamos que estamos observando um determinado fenômeno de interesse por um certo período
de tempo de comprimento t com o interesse de contar o número de vezes X que determinado evento
ocorre.

83
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Vamos fazer as seguintes hipóteses sobre a forma como esse evento ocorre:
H1) Em um intervalo de tempo suficientemente curto, apenas 0 ou 1 evento ocorre, ou seja, 2 ou mais
ocorrências não podem acontecer simultaneamente. Então, em cada um desses intervalos temos um
experimento de Bernoulli.
H2) A probabilidade de exatamente 1 ocorrência nesse pequeno intervalo de tempo, de comprimento
Δt, é proporcional a esse comprimento, ou seja, é λΔt. Logo, a ocorrência de nenhum evento é 1 − λΔt.
H3) As ocorrências em intervalos pequenos e disjuntos são experimentos de Bernoulli independentes.
Estamos interessados na v.a. X = número de ocorrências do evento no intervalo (0, t]. Particionando esse
intervalo em n pequenos subintervalos de comprimento Δt, temos que o número total de ocorrências será
a soma do número de ocorrências em cada subintervalo. Mas em cada subintervalo podemos aplicar as

hipóteses acima. Logo, X é uma variável binomial com parâmetros n = e probabilidade de

sucesso igual a λΔt pela hipótese 2 acima. Então, para k = 0, 1, 2, . . . , n temos que:

Consideremos, agora, a situação em que Δt → 0, ou equivalentemente, n → ∞. Nesse caso, a v.a. X

pode assumir qualquer valor inteiro não negativo e

Teorema Sejam eventos gerados de acordo com as hipóteses H1 a H3 acima. Se X é o número de

eventos em um intervalo de tempo de comprimento t, então a função de distribuição de probabilidade de
Xé

Diz-que que X tem distribuição de Poisson com parâmetro λt : X ∼ Poi(λt).

Para mostrar que realmente define uma fdp, temos que provar que , temos que:

84
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Esperança e variância
Vamos agora calcular a esperança e a variância de tal distribuição.

Logo,

A interpretação desses resultados nos dá que o número médio de ocorrências do evento em um

intervalo de comprimento t é λt, proporcional ao comprimento. Fazendo t = 1, obtém-se o número médio
de ocorrências em um intervalo unitário. Note que a esperança e a variância são iguais!

A distribuição de Poisson
Vamos apresentar, agora, a definição geral da distribuição de Poisson, usando uma outra
parametrização.
Diz-se que a v.a. X tem distribuição de Poisson com parâmetro μ se sua fdp é dada por

Nesse caso, a esperança e a variância de X são dadas por:

85
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Pelos resultados anteriores, μ é o número médio de ocorrências do evento de interesse em um
intervalo unitário e o número de ocorrências num intervalo qualquer é proporcional ao comprimento do
intervalo.

Exemplo
1. Uma central telefônica recebe uma média de 5 chamadas por minuto. Supondo que as chamadas
que chegam constituam uma distribuição de Poisson, qual é a probabilidade de a central não receber
nenhuma chamada em um minuto? e de receber no máximo 2 chamadas em 2 minutos?
Solução:
Seja X = número de chamadas por minuto. Então, X ∼ P oi(5). Logo,

Seja y = número de chamadas em 2 minutos. Então, X ∼ Poi(5 × 2). Logo,

Questões

01. Joga-se um dado equilibrado. Qual é a probabilidade de serem necessários 10 lançamentos até a
primeira ocorrência de um seis?
(A) 0,0323
(B) 0,0677
(C) 0,0548
(D) 0,0452
(E) 0,0125

02. Dois adversários A e B disputam uma série de 8 partidas de um determinado jogo. A probabilidade
de A ganhar uma partida é 0,6 e não há empate. Qual é a probabilidade de A ganhar a série?
(A) 24,5%
(B) 59,4%
(C) 36%
(D) 48%
(E) 20%

03. Joga-se uma moeda não viciada. Qual é a probabilidade de serem obtidas 5 caras antes de 3
coroas?
(A) 35%
(B) 77,3%
(C) 65%
(D) 50%
(E) 22,7%

04. Entre os 16 programadores de uma empresa, 12 são do sexo masculino. A empresa decide sortear
5 programadores para fazer um curso avançado de programação. Qual é a probabilidade dos 5 sorteados
serem do sexo masculino?
(A) 18,13%
(B) 50%
(C) 75%
(D) 25,45%
(E) 74,55%

86
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
05. Em um certo tipo de fabricação de fita magnética, ocorrem cortes a uma taxa de um corte por 2000
pés. Qual é a probabilidade de que um rolo com comprimento de 4000 pés apresente no máximo dois
cortes? Pelo menos dois cortes?
(A) 0,676676 e 0,593994
(B) 0,323324 e 0,406006
(C) 0,5 e 0,5
(D) 0,125885 e 0,365896
(E) 0,478963 e 0,258963

Comentários

01. Resposta: A.
Nesse caso, sucesso é a ocorrência de face seis. Logo, Pr(sucesso) = p = e Pr(fracasso) =
1−p= Seja X = número de lançamentos até primeiro seis. Então, X ∼ geom e o problema pede Pr
(X = 10) = = 0, 03230.

02. Resposta: B.
Note que só podem ocorrer vitórias ou derrotas, o que significa que temos repetições de um
experimento de Bernoulli com probabilidade 0,6 de sucesso (vitória). Assumindo a independência das
provas, se definimos X = número de vitórias de A, então X ∼ bin(8; 0, 6) e o problema pede Pr (X ≥ 5) ,
isto é A ganha mais partidas que B.

03. Resposta; E.
Vamos definir sucesso = cara e fracasso = coroa. Então, Pr(sucesso) = Pr(fracasso) = 0, 5 e temos
repetições de um experimento de Bernoulli. A ocorrência de 5 sucessos antes de 3 fracassos só é possível
se nas 7 primeiras repetições tivermos pelo menos 5 sucessos. Seja, então, X = número de sucessos em
7 repetições. Logo, X ∼ bin(7; 0, 5) e o problema pede Pr(X ≥ 5).

04. Resposta: A.
Sucesso = sexo masculino. Se X = número de homens sorteados, então X ∼ hiper(16; 12; 5) e o
problema pede

05. Resposta: A.
Seja Y = número de cortes num rolo de 4000 pés. Então, Y ∼ P oi(2).

87
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
LEI DOS GRANDES NÚMEROS

A lei dos grandes números é uma das principais leis assintóticas da estatística, sua ideia é bastante
intuitiva, mas de grande importância. Antes de enunciarmos esta lei, vamos tentar analisar a ideia intuitiva
dela.
Por exemplo, seja X uma variável aleatória que representa o lançamento de uma moeda honesta, no qual
e Se lançarmos essa moeda n vezes então temos que a média aritmética dos
valores observados tendem a 1/2, ou seja, tendem a A lei dos grandes números nos diz que a média
aritmética dos valores observados tendem a esperança da variável aleatória.
Um outro exemplo, é quando lançamos um dado equilibrado, com as faces numeradas de 1 a 6. A

probabilidade de obtermos o número 4 é de pois os eventos são equiprováveis. Vamos

simular os resultados no computador da seguinte forma. Primeiramente lançamos os dados 100 vezes e
anotamos quantas vezes a face 4 aparece nos resultados e por fim calculamos a proporção de vezes que
a face 4 aparece. Repetimos isto para 1000 e 10000 lançamentos. Assim, obtemos os seguintes
resultados:

Face do dado igual Proporção de face igual

Lançamentos
a4 a4

100 11 0,11

1000 159 0,159

10000 1660 0,166

Observe que quanto maior o número de lançamentos do dado, mais o resultado experimental se
aproxima da probabilidade esperada.

Leis Forte e Lei Fraca dos números5

A principal diferença entre a lei fraca e a lei forte dos grandes números é que a primeira converge em
probabilidade e a segunda converge quase certamente. A convergência em probabilidade é uma
convergência mais fraca que a convergência quase certa, pois se houver convergência quase certa há
convergência em probabilidade. Vejamos isto através da seguinte proposição.
Proposição: Se uma sequência de variáveis aleatórias sobre um espaço de probabilidade
converge quase certamente para uma variável aleatória então em probabilidade.

Lei fraca de Chebyshev

Sejam uma sequência enumerável de variáveis aleatórias independentes dois a dois. Se a sequência
tem variância finita e uniformemente limitada, ou seja, existe uma constante tal que
. Então a sequência satisfaz a Lei Fraca dos Grandes Números:

em que

Lei fraca de Khintchine

Sejam uma sequência enumerável de variáveis aleatórias independentes e identicamente distribuídas
e integráveis com média Então satisfazem a Lei Fraca do Grandes Números:

5 http://www.portalaction.com.br/probabilidades/72-lei-dos-grandes-numeros

88
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Lei fraca dos Grandes Números de Bernoulli
Seja uma sequência de ensaios de bernoulli independentes, com mesma probabilidade de sucesso.
Então

em que

Exemplos

01. Seja uma sequência de variáveis aleatórias, mostre que se e , então

Como temos que para cada , existe tal que para .

Assim, para todo temos que:

pois

Logo,

Mas pela desigualdade de Chebyshev para todo .

Portanto para todo

mas como , quando , concluímos que .

02. Suponha que em uma fábrica borracha o número de borrachas produzidas por dia seja uma variável
aleatória X com média . Estime a probabilidade de que a produção diária seja maior que 210.
Neste caso basta usarmos a desigualdade de Markov, e obtemos o seguinte resultado:

03. Se no exemplo acima a variância de X é igual a 20, qual a probabilidade de que a produção do dia
esteja entre 40 e 100 borrachas produzidas ?
Utilizando a desigualdade de Chebyshev, obtemos que:

ou seja,

Desta forma a probabilidade de que a produção do dia esteja entre 40 e 100 borrachas produzidas é
de aproximadamente 97,7%.

04. Seja uma sequência de eventos aleatórios com o mesmo espaço de probabilidades. Seja a
função indicadora de do conjunto , mostremos que se, e somente se, .
Primeiramente vamos supor que . Então dado , definimos
Observe que se , então pois assume apenas os valores zero ou 1 e neste caso
e o resultado segue trivialmente.
Sendo assim, basta considerarmos apenas o caso em que
Assim, temos que

89
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Logo obtemos que:

o que implica que , ou seja,

Agora vamos supor que , isto é, , então neste caso temos que:

Portanto

05. Uma variável com variância zero é um valor determinístico.

De fato, seja X uma variável aleatória com variância zero pela desigualdade de Chebyshev
temos que

Portanto, com probabilidade 1, isto é, é determinístico.

Lei Forte dos Grandes Números

Sejam uma sequência de variáveis aleatórias independentes e identicamente distribuídas. Se

, então com probabilidade 1, a sequência

não é limitada.

Teorema: Seja uma sequência de variáveis aleatórias independentes tais que e a

. Então para todo ,

Primeira Lei Forte de Kolmogorov6

Seja uma sequência de variáveis aleatórias independentes e integráveis, e suponha que:

(condição de Kolmogorov)
então

Exemplo

Valor esperado infinito implica em variância infinita.

De fato, seja uma variável aleatória tal que
Por definição, temos que
Mas, e
Portanto,
Em particular, variáveis aleatórias com valor esperado infinito não satisfazem a condição de
Kolmogorov e consequentemente não há garantias que cumpra a lei dos grandes números.

6 http://www.portalaction.com.br/probabilidades/722-lei-forte-dos-grandes-numeros

90
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
TEOREMA CENTRAL DO LIMITE

O teorema central do limite7 consiste em um importante teorema da teoria assintótica, no qual a ideia
central baseia-se em encontrar a distribuição da somas parciais normalizadas, o qual demonstramos que
converge para a distribuição normal padronizada.
Sejam uma sequência de variáveis aleatórias independentes e identicamente distribuídas,

com média e variância para , em que . Definimos , então

Condição de Lindeberg

Seja sequência de variáveis aleatórias independentes com e existem

e são finitos e tomamos Então

Corolário: Sejam variáveis aleatórias independentes e identicamente distribuídas com

distribuição binomial com parâmetro . Então

converge em distribuição para uma normal padronizada

Teorema: Seja uma sequência de variáveis aleatórias independentes e quadrado integráveis,

para algum e Definimos

Então

converge em distribuição para quando .

Proposição: Seja uma sequência de variáveis aleatórias independentes e identicamente

distribuídas com e , em que

Condição de Lyapunov

Seja sequência de variáveis aleatórias independentes com e existem

e são finitos e tomamos Então

7 http://www.portalaction.com.br/probabilidades/732-teorema-central-do-limite

91
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Proposição: Seja uma sequência de variáveis aleatórias independentes e satisfaz as condições

de Lyapunov. Então converge em distribuição

Proposição: Seja uma sequência de variáveis aleatórias independentes tal que para todo

em que é uma constante e quando Então

e satisfaz as condições do Teorema Central do Limite.

Exemplos

01. Seja e . Então temos que para todo

Desde que é contínua, esta convergência é uniforme. Assim,

Em particular, obtemos que

Portanto, para n suficientemente grande, tem distribuição aproximadamente normal com média
e variância

02. Um candidato a prefeito da cidade de São Carlos gostaria de ter uma ideia de quantos votos receberá
nas próximas eleições. Para isto, foi feito uma pesquisa com os cidadãos, em que representa a
proporção de votos do candidato com Quantas pessoas devem ser entrevistadas com 95% de
confiança para que o valor de tenha sido determinado com erro inferior a 5%, supondo que as escolhas
de cada pessoa sejam independentes.
Seja o número de candidatos, denotamos a variável aleatória de Bernoulli que assume
valor 1, com probabilidade p, se a i-ésima pessoa entrevistada declara a intenção de votar no candidato.
Assume o valor 0, com probabilidade caso contrário.

Assim e Consequentemente, e para todo

Logo, do enunciado queremos mínimo de modo que

em que
Mas, temos que

Pelo TCL, temos que para suficientemente grande

92
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Logo, basta escolhermos tal que

Como temos que

Portanto, devemos entrevistar pelo menos 385 eleitores.

NÚMEROS RELATIVOS

Conceito de relativo8 é associado à variação do valor, preço ou quantidade de um único produto para
uma dada operação econômica (consumo, exportação), entre dois períodos. Por ser a variação de um
único produto, o seu cálculo pode ser feito diretamente pela razão dos valores entre o período final e o
inicial.

Variação nos preços: sendo M o multiplicador do produto i entre os períodos 0 e t; p os preços no

produto i, nos períodos 0 e t

pti
M i
p0 , t =
p0i
A variação calculada acima é expressa como multiplicador. Para ser considerada um número-índice
deve ser multiplicada por 100.

Variação nas quantidades:

Multiplicador
qti
M q0 ,t = i
i
q0
Número-índice
qti
Q0,t = i x100
u
q0
Período Base
É o período ao qual todos os relativos de uma série estão associados.

Exemplo: série com base fixa no período 0:

p01 número-índice entre o período 0 e 1

p02 número-índice entre o período 0 e 2
p03 número-índice entre o período 0 e 3 ....

8
https://www.inf.ufsc.br/~marcelo.menezes.reis/Cap5.pdf

93
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Calculando número-índice
Para base = 1985
Para 1987, quantidade: (7*100/2) = 350

A variação de valor entre 1985 e 88 foi de (1450/100)*(750/100) = 108,75 (multiplicador) ou

(108,75-1)*100 = 10.775% (variação percentual)

Mudando de Período – BASE

Supondo que o período-base mude para 1987, já tendo os números-índice para 1985, basta fazer
uma regra de três:
Preços 1985 = (100/450) *100 = 22,22
Quantidade 1988 = (750/350) *100 = 214,29

Preço Quantidade Valor

1985 22,22 28,57 6,35

1986 33,33 71,43 23,81
1987 100,00 100 100
1988 322,22 214,29 690,48

Bases de uma série de números-índice

Base Fixa
A série de números-índice é toda referenciada ao mesmo período (fixo)
v01, v02, v03, v04, ...

Base Móvel
O período de referência (base) muda para cada elo relativo calculado.
Base no período anterior: p01, p12, p23,pn-1,n

NÚMEROS ÍNDICES

Os números-índices9 são medidas estatísticas frequentemente usadas por administradores,

economistas e engenheiros, para comparar grupos de variáveis relacionadas entre si e obter um quadro
simples e resumido das mudanças significativas em áreas relacionadas como preços de matérias-primas,
preços de produtos acabados, volume físico de produto etc.
Mediante o emprego de números-índices é possível estabelecer comparações entre:
a) variações ocorridas ao longo do tempo;
b) diferenças entre lugares;
c) diferenças entre categorias semelhantes, tais como produtos, pessoas, organizações etc.

É grande a importância dos números-índices para o administrador, especialmente quando a moeda

sofre uma desvalorização constante e quando o processo de desenvolvimento econômico acarreta
mudanças continuas nos hábitos dos consumidores, provocando com isso modificações qualitativas e
quantitativas na composição da produção nacional e de cada empresa individualmente. Assim, em
qualquer análise, quer no âmbito interno de uma empresa, ou mesmo fora dela, na qual o fator monetário
se encontra presente, a utilização de números-índices toma-se indispensável, sob pena de o analista ser
conduzido a conclusões totalmente falsas e prejudiciais à empresa.

9 https://www.inf.ufsc.br/~marcelo.menezes.reis/Cap5.pdf

94
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Por exemplo, se uma empresa aumenta seu faturamento de um período a outro, isso não quer dizer
necessariamente que suas vendas melhoraram em termos de unidades vendidas. Pode ter ocorrido que
uma forte tendência inflacionaria tenha obrigado a empresa a aumentar acentuadamente. Os preços de
seus produtos, fazendo gerar um acréscimo no faturamento (em termos "nominais"), o qual, na realidade,
não corresponde a uma melhora de situação.
Fora dos problemas gerados por alterações nos preços dos produtos, os números-índices são úteis
também em outras áreas de atuação da empresa como, por exemplo, no campo da pesquisa de mercado.
Neste caso, podem ser utilizados nas mensurações do potencial de mercado, na análise da lucratividade
por produto, por canais de distribuição etc. Em suma, os números-índices são sempre úteis quando nos
defrontamos com análises comparativas.
Para o economista, o conhecimento de números-índices é indispensável igualmente como um
instrumento útil ao exercício profissional, quer seus problemas estejam voltados para a microeconomia
quer para a macroeconomia. No primeiro caso, poder-se-ia citar, por exemplo, a necessidade de se saber
até que ponto o preço de determinado produto aumentou com relação aos preços dos demais produtos
em um mesmo mercado. Se, por outro lado, o problema for quantificar a inflação, serem preciso medir o
crescimento dos preços dos vários produtos como um todo, através do índice geral de preços.
Sob os aspectos acima considerados, pode-se vislumbrar a noção de agregado subjacente ao conceito
de número-índice. Por essa razão, costuma-se conceber o número-índice como uma medida utilizada
para proporcionar uma expressão quantitativa global a um conjunto de medidas que não podem ser
simplesmente adicionadas em virtude de apresentarem individualmente diferentes graus de importância.
Cada número-índice de uma série (de números) costuma vir expresso em termos percentuais. Os
índices mais empregados medem, em geral, variações ao longo do tempo e exatamente nesse sentido
que iremos tratá-los neste capítulo. Além disso, limitaremos o estudo às suas principais aplicações no
campo de administração e de economia, as quais se situam no âmbito das variações de preços e de
quantidades.

Conceito de Relativo

A quantidade total de dinheiro gasto cada ano, em relação a certo ano base, varia de um ano para
outro devido as variações no número de unidades compradas dos diferentes artigos e igualmente devido
a mudanças nos preços unitários de tais artigos. Temos, portanto, três variáveis em jogo: preço,
quantidade e valor, sendo este último o resultado do produto do preço pela quantidade.

Relativo (Relação) de Preço

Trata-se do número-índice mais simples. Relacionando-se o preço de um produto numa época

(chamada época atual ou época dada) com o de uma época o (chamada básica ou simplesmente base)
teremos um relativo de preço. Fazendo-se P t = preço numa época atual e Po preços na época-base.

Relativo (Relação) de Quantidade

Assim como podemos comparar os preços de bens, podemos também fazê-lo em re1ação a
quantidades, querem sejam elas quantidades produzidas, vendidas ou consumidas. Se fizermos q =
quantidade de um produto na época atual (época t) é q 0 = quantidade desse mesmo produto na época
zero (básica).

Relativo (Relação) de Valor

Se p for o preço de determinado artigo em certa época e q a quantidade produzida ou consumida

desse mesmo artigo na mesma época, então, o produto p x q será denominado valor total de produção
ou de consumo. Sendo p t e q t respectivamente, o preço e a quantidade de um artigo na época atual (t)
e p0 e q0, o preço e a quantidade do mesmo artigo na época básica (0).

Emprego de Índices (Agregativos) Ponderados

Como vimos, os índices simples apresentam algumas desvantagens, em especial à se refere à

inexistência de pesos diferentes para cada utilidade que os compõe de acordo com sua importância
relativa. No caso dos índices ponderados, além da fórmula a ser usada para interpretar as variações de
preço e de quantidade dos bens, há o problema do critério para a fixação dos pesos relativos de cada um

95
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
deles. A ponderação proposta pelos métodos mais usados baseia-se na participação de cada bem no
valor transacionado total e é feita, em geral, segundo dois critérios: peso fixo na época básica ou peso
variável na época atual.

Índice de Laspeyres ou Método da época Básica

No índice de Laspeyres a ponderação é feita em função dos preços e quantidades do período base.
Por causa disso ele tende a exagerar a alta, por considerar as quantidades (ou preços) iguais aos do
período base. As equações:

Onde n é o número de itens, pt,i é o preço de um item qualquer no período "atual", p 0,i é o preço de um
item qualquer no período base, q t,i é a quantidade de um item qualquer no período atual, e q 0,i é a
quantidade de um item qualquer no período base.

Exemplo
Com os dados da tabela a seguir, e usando 2014 como base, obter índices de Laspeyres de preço e
quantidade.

Devemos usar as fórmulas do índice de Laspeyres sabendo que o período base é 2014. Então os
denominadores dos índices serão o resultado da soma dos produtos dos preços e quantidades de cada
item no período base, 2014. Os numeradores utilizarão as quantidades (ou preços) de 2014 como
ponderação.

Os preços dos artigos aumentaram 18,52%

Os preços dos artigos aumentaram 70,37% (170,37 - 100) de 2014 a 2016.

96
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
As quantidades dos artigos aumentaram 51,85% (151,85 - 100) de 2014 a 2015.

As quantidades dos artigos aumentaram 88,89% (188,89 - 100) de 2014 a 2016

Índice de Paasche

No índice de Paasche a ponderação é feita em função dos preços e quantidades do período atual. Por
causa disso ele tende a exagerar a baixa, por considerar as quantidades (ou preços) iguais aos do período
atual. A mudança constante da época “atual” pode encarecer a pesquisa para identificar os pesos. Por
essa razão os índices de preços, que costumam fazer as ponderações dos diversos itens com base em
pesquisas de orçamentos familiares, geralmente utilizam a fórmula de Laspeyres (ou alguma modificação
dela).

Exemplo, vamos usar os mesmos dados do item anterior

Com os dados da tabela a seguir, e usando 2014 como base, obter índices de Paasche de preços e
quantidades

Devemos usar as fórmulas do índice de Paasche sabendo que o período base é 2014. Então os
numeradores dos índices serão o resultado da soma dos produtos dos preços e quantidades de cada
item no período atual, que irá mudar à medida que os anos passam. Os denominadores utilizarão os
preços (ou quantidades) de 2014, ponderadas pelas quantidades (ou preços) do período atual.

97
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Os preços dos artigos aumentaram 17,07% de 2014 a 2015.

Os preços dos artigos aumentaram 64,71% de 2014 a 2016.

As quantidades dos artigos aumentaram 50% de 2014 a 2015.

As quantidades dos artigos aumentaram 82,61% de 2014 a 2016.

Observe que os valores apresentam a mesma ordem de grandeza que os índices de Laspeyres, mas
obviamente são diferentes.

Mudança de base de um número índice

A escolha da base de um número índice é muitas vezes uma tarefa difícil. É preciso escolher um
período relativamente estável, o mais "típico" possível, quando a atividade econômica não estiver sendo
afetada por variações estruturais ocasionais. No Brasil, onde a economia parece estar sendo sempre
sacudida, em maior ou menor grau, por flutuações e crises de todo tipo a escolha da base torna-se ainda
mais controvertida: talvez por isso haja tanta predileção pelos índices relativos de ligação.

De qualquer forma, independente do índice, pode ser interessante, ou necessário, mudar a base de
um número índice por duas razões:
- para atualizar a base, tornando-a mais próxima da realidade atual (por este motivo, periodicamente
o IBGE realiza pesquisas de orçamento familiar, com a finalidade de incluir as mudanças nos hábitos de
consumo nas ponderações dos seus índices).
- para permitir a comparação de duas séries de índices que tenham bases diferentes.

O procedimento é extremamente simples: basta dividir toda a série de números índices originais pelo
número índice do período escolhido como nova base. Isso preservará as diferenças relativas entre eles.

Exemplo

Mudar a base da série de números índices abaixo para 2013.

Ano 2011 2012 2013 2014 2015 2016

Índice 100 109,12 113,86 116,69 126,53 133,20
Novo 87,83 95,84 100 102,49 111,13 116,99
Índice

98
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Para o ano de 2011 teremos: novo índice = (100/113,86) x 100 = 87,83
Para o ano de 2012 teremos: novo índice = (109/113,86) x 100 = 95,84
Para o ano de 2013 teremos: novo índice = (113,86/113,86) x 100 = 100
Para o ano de 2014 teremos: novo índice = (116,69/113,86) x 100 = 102,49
Para o ano de 2015 teremos: novo índice = (126,53/113,86) x 100 = 111,13
Para o ano de 2016 teremos: novo índice = (133,20/113,86) x 100 = 116,99

Questões

01. (TJ/RO – Estatístico – FGV) A Lei dos Grandes Números existe em duas versões que tratam de
convergências de tipos distintos. A Lei Fraca e a Lei Forte abordam, respectivamente, convergências:
(A) em probabilidade e em distribuição;
(B) quase certa e em probabilidade;
(C) em distribuição e quase certa;
(D) em distribuição e em probabilidade;
(E) em probabilidade e quase certa.

02. (TJ/AL – Analista Judiciário – FGV/2018) A Lei dos Grandes Números se apresenta em duas
versões, uma versão forte e outra fraca.

Sobre essas duas versões, é correto afirmar que:

(A) a lei forte expressa é condição necessária para que se tenha uma convergência em probabilidade;
(B) a lei fraca é equivalente a uma convergência quase certa;
(C) a lei fraca pode ser empregada para verificar a propriedade de consistência de estimadores
pontuais;
(D) a lei fraca expressa é condição necessária para que se tenha uma convergência em distribuição;
(E) a lei forte é usada para mostrar que o conceito frequencial de probabilidade converge para o
conceito clássico.

03. (IBGE – Analista de Sistemas – CESGRANRIO) A tabela abaixo apresenta as quantidades e os

preços unitários de 4 produtos vendidos, em uma mercearia, durante o 1° trimestre de 2009.

Para o conjunto dos 4 produtos apresentados, o índice de preços de Laspeyres referente ao mês de
março, tendo como base o mês de janeiro, vale, aproximadamente,
(A) 79
(B) 81
(C) 108
(D) 123
(E) 127

04. (Receita Federal – Auditor Fiscal – ESAF) Considerando-se os dados sobre os preços e as
quantidades vendidas de dois produtos em dois anos consecutivos, assinale a opção correta.

(A) O índice de Laspeyres indica um aumento de 50% no nível de preços dos dois produtos, enquanto
o índice de Paasche indica uma redução de 50%.
(B) Os fatores de ponderação no cálculo do índice de Laspeyres são 80 para o preço relativo do produto
1 e 240 para o preço relativo do produto 2.
(C) O índice de Laspeyres indica um aumento de 25% no nível de preços dos dois produtos, enquanto
o índice de Paasche indica uma redução de 75%.

99
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
(D) Os fatores de ponderação no cálculo do índice de Paasche são 240 para o preço relativo do produto
1 e 80 para o preço relativo do produto 2.
(E) O índice de Laspeyres indica um aumento de 25% no nível de preços dos dois produtos, enquanto
o índice de Paasche indica uma redução de 25%.

Comentários

01. Resposta: E.
A principal diferença entre a lei fraca e a lei forte dos grandes números é que a primeira converge em
probabilidade e a segunda converge quase certamente. A convergência em probabilidade é uma
convergência mais fraca que a convergência quase certa, pois se houver convergência quase certa há
convergência em probabilidade.

02. Resposta: C.

03. Resposta: D.
Laspeyres - preço = Σpn.qo/Σpo.qo
Laspeyres - preço = [ 2,5.5 + 4.4 + 2,75.3 + 2.2 ] / [ 2,5.5 + 3.4 + 2.3 + 1,25.2 ]
Laspeyres - preço = [ 12,25 + 16 + 8,25 + 4 ] / [ 12,5 + 12 + 6 + 2,5 ]
Laspeyres - preço = 40,75 / 33 = 1,2348
Assim teremos 123 – 100 = 23%.

04. Resposta:
Índice de preços de Laspeyre
Índice de preço de Paasche
Fórmulas:
∑𝑃 𝑄
La = 𝑛 0
∑𝑃0 𝑄0

∑𝑃𝑛 𝑛
Pa =
∑𝑃0 𝑄𝑛

A questão não nos deu o ano base, mas, só há dois anos envolvidos, então, o bom senso nos diz que
o ano 1 será o ano de referência, daí, devemos dizer qual a evolução dos preços do ano 2 em relação ao
ano 1.
Agora basta substituir nas fórmulas, para chegarmos a:
(60 x 6) + (20 x 2) 400
(p) La = (40 x 6) + (40 x 2) = 320 = 1,25 x 100 = 125, ou seja, aumento de 25%.

Trabalhando com o Paasche

(60 x 2) + (20 x 6) 240
(p) Pa =(40 x 2) + (40 x 6) = 320 = 0,75
0,75 x 100 = 75%, daí, de acordo com o índice de Paasche, houve uma redução de 25% no nível de
preço daqueles dois produtos.
Para Layspeyer houve aumento de 25%
Para Paasche houve redução de 25%

3 Inferência estatística. 3.1 Estimação pontual: métodos de estimação,

propriedades dos estimadores, suficiência. 3.2 Estimação intervalar: intervalos
de confiança, intervalos de credibilidade. 3.3 Testes de hipóteses: hipóteses
simples e compostas, níveis de significância e potência de um teste, teste t de
Student, teste qui-quadrado.

INFERÊNCIA

Inferência estatística é um ramo da Estatística cujo objetivo é fazer afirmações a partir de um conjunto
de valores representativo (amostra) sobre um universo. Tal tipo de afirmação deve sempre vir
acompanhada de uma medida de precisão sobre sua veracidade. Para realizar este trabalho o estatístico

100
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
coleta informações de dois tipos, experimentais (as amostras) e aquelas que obtém na literatura. As duas
principais escolas de inferência são a inferência frequentista (ou clássica) e a inferência bayesiana. A
inferência estatística é geralmente distinta da estatística descritiva. A descrição estatística pode ser vista
como a simples apresentação dos fatos, nos quais o modelo de decisões feito pelo analista tem pouca
influência. É natural que análises estatísticas avancem, indo da descrição para a inferência de padrões.
Essa última tarefa depende do modelo usado e/ou criado pelo analista dos dados.

Inferência frequentista é um tipo de inferência estatística. O conceito frequentista de probabilidade

envolve basicamente uma sequência de repetições para um determinado evento, tratado como um
subconjunto de Θ. A ideia da repetição justifica a denominação “teoria frequentista”. A teoria baseia-se
na regularidade estatística das frequências relativas e sustenta que a probabilidade de um dado
acontecimento pode ser medida observando a frequência relativa do mesmo acontecimento, em uma
sucessão numerosa de experiências idênticas e independentes. Para exemplificar a interpretação
frequentista, considera-se uma moeda irregular (viciada) lançada 1000 vezes, e observam-se a face cara
540 vezes. Portanto, a probabilidade estimada de sair cara é 0,54.

Inferência bayesiana é um tipo de inferência estatística que descreve as incertezas sobre quantidades
invisíveis de forma probabilística. Incertezas são modificadas periodicamente após observações de novos
dados ou resultados. A operação que calibra a medida das incertezas é conhecida como operação
bayesiana e é baseada na fórmula de Bayes. A fórmula de Bayes é muitas vezes denominada Teorema
de Bayes.

Em teoria da probabilidade o Teorema de Bayes mostra a relação entre uma probabilidade condicional
e a sua inversa; por exemplo, a probabilidade de uma hipótese dada a observação de uma evidência e a
probabilidade da evidência dada pela hipótese. Esse teorema representa uma das primeiras tentativas de
modelar de forma matemática a inferencia estatística, feita por Thomas Bayes (pronunciado /ˈbeɪz/ ou
"bays"). O teorema de Bayes é um corolário do teorema da probabilidade total que permite calcular a
seguinte probabilidade:

- Pr (A) e Pr (B) são as probabilidades a priori de A e B

- Pr (B|A) e Pr (A|B) são as probabilidades a posteriori de B condicional a A e de A condicional a B
respectivamente.

A regra de Bayes mostra como alterar as probabilidades a priori tendo em conta novas evidências de
forma a obter probabilidades a posteriori. Podemos aplicar o Teorema de Bayes com o jogo das três
portas. Alguns preferem escrevê-lo na forma:

A ideia principal é que a probabilidade de um evento A dado um evento B (e.g. a probabilidade de

alguém ter câncer de mama sabendo, ou dado, que a mamografia deu positivo para o teste) depende não
apenas do relacionamento entre os eventos A e B (i.e., a precisão, ou exatidão, da mamografia), mas
também da probabilidade marginal (ou "probabilidade simples") da ocorrência de cada evento. Por
exemplo, se as mamografias acertam em 95% dos testes, então 5% é a probabilidade de termos falso
positivo ou falso negativo, ou uma mistura de falso positivo a falso. O teorema de Bayes nos permite
calcular a probabilidade condicional de ter câncer de mama, dado uma mamografia positiva, para
qualquer um desses casos. A probabilidade de uma mamografia positiva será diferente para cada um dos
casos.
No exemplo dado, há um ponto de grande importância prática que merece destaque: se a prevalência
de mamografias resultado positivo para o câncer é, digamos, 5,0%, então a probabilidade condicional de
que um indivíduo com um resultado positivo na verdade não tem câncer é bastante pequena, já que
aprobabilidade marginal deste tipo de câncer está mais perto de 1,0%. A probabilidade de um resultado
positivo é, portanto, cinco vezes mais provável que a probabilidade de um câncer em si. Além disso,
alguém pode deduzir que a probabilidade condicional que mamografias positivas realmente tenham
câncer é de 20%. Isso poderia ser menor, se a probabilidade condicional que dado um câncer de mama,

101
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
a mamografia sendo positiva não é de 100% (i.e. falso negativos). Isso serve para mostrar a utilidade do
entendimento do teorema de Bayes.

Questão
01. Considerando a tabela

Calcule o índice ponderado para preços, empregando a fórmula de Laspeyres e tomando 1993 = 100.

Resposta

01. Resposta: 1,625 ou 162,5%.

Lembrando que

Temos:

= 1,625 ou 162,5%.

INTERVALO DE CONFIANÇA

Em estatística, um intervalo de confiança (IC) é um intervalo estimado de um parâmetro estatístico.

Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. Quão
prováveis são estas estimativas é determinado pelo coeficiente de confiança. Quanto maior a
probabilidade do intervalo conter o parâmetro, maior será o intervalo. Intervalos de confiança são usados
para indicar a confiabilidade de uma estimativa. Por exemplo, um IC pode ser usado para descrever quão
confiáveis são os resultados de uma pesquisa. Sendo todas as outras coisas iguais, uma pesquisa que
resulte num IC pequeno é mais confiável do que uma que resulte num IC maior.
Em sentido restrito, um IC para um parâmetro populacional é um intervalo com uma proporção p
associada a qual é gerada por uma amostra aleatória de uma população subjacente, de tal forma que se
a amostragem for repetida inúmeras vezes e o intervalo de confiança for recalculado para cada amostra
de acordo com o mesmo método, uma proporção p dos intervalos de confiança conteria o parâmetro
estatístico em questão. Intervalos de confiança são a forma predominante de estimativa por intervalo.
Se U e V são estatísticas (isto é, variáveis aleatórias) cuja distribuição de probabilidade dependa de
algum parâmetro não observável θ, e

(onde x é um número entre 0 e 1) então o intervalo aleatório (U, V) é um intervalo de confiança "100x%
para θ". O número x é chamado de nível de confiança ou coeficiente de confiança. Na prática moderna
aplicada, a maioria dos intervalos de confiança estão no nível de 95%. Intervalos de confiança
desempenham em probabilidade frequentista um papel semelhante ao intervalo de credibilidade em
estatística bayesiana.

102
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Neste diagrama, as barras representam as médias observadas e as linhas vermelhas representam os
intervalo de confiança ao redor delas. A diferença entre as duas populações à esquerda é significante.
Todavia, "é um equívoco estatístico comum supor que duas quantidades cujos intervalos de confiança de
95% falhem em se sobrepor sejam significativamente diferentes no nível dos 5%".

Exemplo

Resolução:

Questões

01. (CNMP – Analista do CNMP – FCC) Uma pesquisa é realizada em uma grande cidade com uma
amostra aleatória de 300 habitantes em que 75% deles manifestaram-se favoráveis à implantação de um
projeto para melhorar o atendimento ao público de sua cidade. Com base nesta amostra, deseja-se obter
um intervalo de confiança de 95% para esta proporção, considerando que a distribuição amostral da
frequência relativa dos habitantes favoráveis ao projeto é normal. Utilizando a informação da distribuição
normal padrão (Z) que as probabilidades P(Z > 1,96) =0,025 e P(Z > 1,64) =0,050, este intervalo de
confiança é, em %, igual a
(A) [71,68 ; 78,32]
(B) [71,34 ; 78,66]
(C) [70,90 ; 79,10].
(D) [70,40 ; 79,60].
(E) [70,10 ; 79,90].

103
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
02. (SEFAZ-PI – Analista do tesouro Estadual – FCC)
Instruções: Para resolver à questão utilize, dentre as informações dadas a seguir, as que julgar
apropriadas.

Se Z tem distribuição normal padrão, então:

P(Z < 0,5) = 0,691; P(Z < 1) = 0,841; P(Z < 1,2) = 0,885; P(Z < 1,28) = 0,90.

Com o objetivo de se estimar a idade média, μ, em anos, de ingresso no primeiro emprego formal de
jovens de determinada comunidade, selecionou-se uma amostra aleatória de 100 jovens da população
de jovens que já haviam ingressado no mercado de trabalho formal. Os resultados obtidos encontram-se
na tabela de distribuição de frequências apresentada a seguir:

Idade (em anos) Frequência Relativa

18 20 0,10
20 22 0,30
22 24 0,35
24 26 0,25

Considere:

I. Que a população de onde a amostra foi retirada é infinita e tem distribuição normal com desvio padrão
igual a 1 ano.

II. Para a estimativa pontual de &mu/ a média aritmética das 100 idades apresentadas, calculada
considerando que todos os valores incluídos num intervalo de classe são coincidentes com o ponto médio
do intervalo.

Nessas condições, o intervalo de confiança para µ, em anos, com coeficiente de confiança igual a
77%, baseado nessa amostra, é dado por
(A) (22,38; 22,62)
(B) (20,40; 22,60)
(C) (21,95; 22,85)
(D) (22,35; 22,65)
(E) (20,30; 22,70)

Respostas

01. Resposta: E.
Dados:
n = 300
Proporção amostral (p) que servirá de base para a construção do Intervalo de Confiança (IC) = 75%
Grau de Confiança (a) = 95%
Tipo de Distribuição: Normal
Z (parâmetro tabelado/convertido da distribuição normal) que será utilizado na questão = o intervalo
de confiança é bicaudal e conterá 95% de grau de confiança. Ou seja, delimitará a área de negação ou
de rejeição em 5%, dividida para os dois lados da cauda. Terá 2,5% de um lado e 2,5% do outro. Portanto,
deverá utilizar o parâmetro P(Z>1,96).
Dessa forma:
Limite Inferior do IC = 75% - 1,96 x √p x (1 − p) / n = 75 - 1,96 x √[75 x 25 / 300] = 70,10
Limite Superior do IC = 75 + 1,96 x √[75 x 25 / 300] = 79,90

02. Resposta: A.
Média = (∑fi . PM)/n → (10 . 19 + 30 . 21 + 35 . 23 + 25 . 25)/100 = 22,5
Amostra: n = 100
Desvio padrão: σ = 1
Confiança = 77%
Significância: α = 100% – Confiança → 100% – 77% = 23%

104
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
α/2 = 11,5%
Z α/2 = 1,2 (tabela)
Erro: Ԑ = Z α/2 . (σ/√n) → 1,2 . (1/√100) = 1,2 . 0,1 = 0,12
Intervalo: µ = média ± Ԑ → 22,5 ± 0,12 = 22,38 e 22,62

TESTES DE HIPÓTESES PARA MÉDIAS E PROPORÇÕES.

Em estatística, um Teste de Hipóteses é um método para verificar se os dados são compatíveis com
alguma hipótese, podendo muitas vezes sugerir a não-validade de uma hipótese. O teste de hipóteses é
um procedimento estatístico baseado na análise de uma amostra, através da teoria de probabilidades,
usado para avaliar determinados parâmetros que são desconhecidos numa população. A expressão teste
de significância foi criada por Ronald Fisher: "Critical tests of this kind may be called tests of significance,
and when such tests are available we may discover whether a second sample is or is not significantly
different from the first”. Um Teste de Hipóteses pode ser paramétrico ou não-paramétrico. Testes
paramétricos são baseados em parâmetros da amostra, por exemplo média e desvio padrão. O uso tanto
dos testes paramétricos como dos não-paramétricos está condicionado à dimensão da amostra e à
respectiva distribuição da variável em estudo.
Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese
alternativa H1.
Hipótese nula (H0): é a hipótese que traduz a ausência do efeito que se quer verificar.
Hipótese alternativas (H1): é a hipótese que o investigador quer verificar.
Nível de significância: a probabilidade de rejeitar a hipótese nula quando ela é efetivamente verdadeira
(ERRO)

Finalidade: avaliar afirmações sobre os valores de parâmetros.

O valor-p é uma estatística muito utilizada para sintetizar o resultado de um teste de hipóteses.
Formalmente, o valor-p é definido como a probabilidade de se obter uma estatística de teste igual ou mais
extrema quanto àquela observada em uma amostra, assumindo verdadeira a hipótese nula.

ESTATÍSTICA DO TESTE

É o valor calculado a partir da amostra que será usado na tomada de decisão.

No exemplo, Zcalc = -2,5.
Zcalc = valor da estimativa - valor alegado para o parâmetro desvio-padrão do estimador.

Erros cometidos nos testes de hipóteses

São dois os tipos de erros que podemos cometer na realização de um teste de hipóteses:
1. Rejeitar a hipótese H0, quando ela é verdadeira.
2. Não rejeitar a hipótese H0, quando ela é falsa.
A Tabela a seguir resume as situações acima.

Aceitar H0 Rejeitar H0
H0 verdadeira Decisão correta Erro do tipo I
H0 falsa Erro do tipo II Decisão correta

Se a hipótese H0 for verdadeira e aceita, ou for falsa e rejeitada, a decisão estará correta. No entanto,
se a hipótese H0 for rejeitada sendo verdadeira, ou se for aceita sendo falsa, a decisão estará errada. O
primeiro destes erros é chamado de Erro do Tipo I e a probabilidade de cometê-lo é denotada pela letra
grega α (alfa); o segundo é chamado de Erro do Tipo II e a probabilidade de cometê-lo é denotada pela
letra grega β (beta). Assim temos,

Considere um teste unilateral dado pelas hipóteses:

105
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Neste caso, a região de rejeição é determinada por , e a interpretação dos erros pode ser
vista como:

A situação ideal é aquela em que ambas as probabilidades, α e β, são próximas de zero. No entanto,
é fácil ver que a medida que diminuímos α, β aumenta. A Figura a seguir apresenta esta relação.

Para um teste de hipóteses do tipo acima, onde estamos interessados em testar a média de uma
população, utilizamos a expressão,

que é a estatística do teste de hipóteses. A partir do Teorema Central do Limite, sabemos que, desde
que tenhamos um tamanho amostral suficientemente grande, esta estatística tem distribuição Normal
padrão, isto é,

A partir dos valores de Z e da especificação do erro cometido, podemos definir a região crítica.
Vamos considerar que o erro mais importante a ser evitado seja o Erro do Tipo I. A probabilidade de
ocorrer o erro do tipo I (α) é denominada nível de significância do teste. O complementar do nível de
significância (1 - α) é denominado nível de confiança. Supondo que o nível de significância α seja
conhecido, temos condições de determinar o(s) valor(es) crítico(s).

TESTE PARA MÉDIA E PROPORÇÃO POPULACIONAL

Considere uma população da qual retiramos uma amostra X 1, X2, ..., Xn. Estamos interessados em
realizar inferência sobre a média populacional μ.

Se não conhecemos o valor do desvio padrão populacional σ e a amostra é pequena, n < 30, devemos
substituir a expressão

pela expressão

onde T tem distribuição t de Student com n-1 graus de liberdade. Para facilitar a execução do teste,
podemos seguir os passos:

106
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Estabelecer as hipóteses:
Fixamos H0: μ = μ0. Dependendo da informação que fornece o problema que estivermos estudando, a
hipótese alternativa pode ter uma das três formas abaixo:
• H1: μ ≠ μ0 (teste bilateral);
• H1: μ > μ0 (teste unilateral à direita);
• H1: μ < μ0 (teste unilateral à esquerda).

Fixar o nível de significância α.

Determinar a região crítica.

• Se o teste é bilateral, determinamos os pontos críticos e tais que
a partir da distribuição t de Student com n-1 graus de liberdade.

• Se o teste é unilateral, determinamos o ponto crítico tal que .

• Se o teste é unilateral à esquerda, determinamos o ponto tal que .

107
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Calcular, sob a hipótese nula, o valor:

Onde:
• : valor da média amostral.
• μ0: valor da média populacional sob a hipótese nula.
• s: valor do desvio padrão amostral.
• n: tamanho da amostra.

Critério:
• Teste bilateral: se ou se , rejeitamos H0. Caso contrário, aceitamos
H0.
• Teste unilateral à direita: se , rejeitamos H0. Caso contrário, aceitamos H0.
• Teste unilateral à esquerda: se , rejeitamos H0. Caso contrário, aceitamos H0.

O p-valor no teste bilateral é dado por

Se o teste é unilateral à direita, o p-valor é dado por

e, se o teste é unilateral à esquerda, o p-valor é dado por

O intervalo de confiança é dado por

se o teste é bilateral. Se o teste é unilateral à direita, então o intervalo de confiança para o parâmetro
μ é dado por

e, se o teste é unilateral à esquerda, então o intervalo de confiança para o parâmetro μ é dado por

Teste de hipóteses. Formalmente, o valor-p é definido como a probabilidade de se obter uma estatística
de teste igual ou mais extrema quanto àquela observada em uma amostra, assumindo verdadeira a
hipótese nula.

Questão

01. (CNMP – Analista – FCC) A probabilidade de sucesso em um experimento é igual a p. Sejam as

hipóteses H0 : p = 2/3 (hipótese nula) e H1 : p = 1/2 (hipótese alternativa). Estabelece-se que H0 é aceita
se e somente se, pelo menos, 2 sucessos forem obtidos em 3 vezes em que o experimento é executado.
A probabilidade de H0 ser rejeitada, dado que H0 é verdadeira, é
(A) 3/8
(B) 2/3
(C) 20/27
(D) 5/9
(E) 7/27

108
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Resposta

01. Resposta: E.
A questão afirmou que H0 é verdadeira, logo:
- sucesso = 2/3 - fracasso = 1/3
P(0) = Combinação3,0 . p0 . q3
P(0) = 1 * 1 * (1/3)³ = 1/27
P(1) = C3,1 . p¹ . q²
P(1) = 3 . (2/3) . (1/3)² = 2/9
P(0) + P(1) = 1/27 + 2/9 = 7/27

Variância Conhecida10

Consideremos uma amostra aleatória simples obtida de uma população com distribuição
normal, com média e variância conhecida. Desta forma, a distribuição amostral da média também é
Normal com média e variância , ou seja,

Assim, temos que

isto é, a variável tem distribuição normal padronizada.

Consideremos que a probabilidade da variável tomar valores entre e é . Os valores
e são obtidos na tabela da distribuição normal conforme mostra a figura a seguir

Então, temos que

ou seja,

10 http://www.portalaction.com.br/inferencia/411-variancia-conhecida

109
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
o que implica que

Com isso, o intervalo de confiança da média é dado por

Exemplo
O projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto
para montar um determinado brinquedo. Lembrando que foi verificado que e , construir
um intervalo de confiança de nível para .
Na tabela da distribuição normal padronizada, obtemos que .
Resolução
Substituindo e na fórmula para o intervalo de confiança, temos

e, portanto,

Uma das principais interpretações do intervalo de confiança consiste em avaliar a incerteza que temos a
respeito de estimarmos o parâmetro populacional a partir de uma amostra aleatória de tamanho .
Variância Desconhecida11
Tendo os conceitos básicos sobre intervalos de confiança, vamos agora tratar uma situação mais realista:
quando a variância da população é desconhecida.
Consideremos uma amostra aleatória simples , obtida de uma população com distribuição
normal, com média e variância desconhecidas. Como neste caso a variância é desconhecida,
utilizaremos a variância amostral no lugar de . Assim, temos que

ou seja, a variável tem distribuição t de Student com graus de liberdade.

Então, ao fixarmos o nível de significância , obtemos da Tabela da distribuição t de Student com
graus de liberdade, o valor , que satisfaz

ou graficamente

11 http://www.portalaction.com.br/inferencia/412-varianca-desconhecida

110
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Analogamente ao caso anterior, obtemos que

ou seja,

Logo, o intervalo com de confiança para , com variância desconhecida, será dado por

Exemplo

Foram realizados testes glicêmicos em 25 pacientes após um jejum de 8 horas. Os resultados são
apresentados na tabela abaixo. Encontrar um intervalo de confiança de nível para a média .

Teste glicêmico (mg/dL)

80 118 100 90 83

117 95 84 102 80

112 78 102 121 82

77 88 73 104 88

132 91 103 140 101

Inicialmente, calculamos a média amostral e o desvio padrão amostral , que são dados por

Como a confiança é de 95%, segue e então, substituindo esses valores na fórmula do

intervalo de confiança, temos que

DISTRIBUIÇÃO NORMAL
CURVA NORMAL
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a
distribuição normal.
Muitas das variáveis analisadas na pesquisa socioeconômica correspondem à distribuição normal ou
dela se aproximam.
O aspecto gráfico de uma distribuição normal é o da Figura 10.1:

111
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Para uma perfeita compreensão da distribuição normal, observe a Figura 10.1 e procure visualizar as
seguintes propriedades:

1°) A variável aleatória X pode assumir todo e qualquer valor real.

2°) A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da
média (𝒙̅), que recebe o nome de curva normal ou de Gauss.

3°) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à
probabilidade de a variável aleatória X assumir qualquer valor real.

4°) A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente
do eixo das abscissas sem, contudo, alcançá-lo.

5°) Como a curva é simétrica em torno de 𝒙 ̅, a probabilidade de ocorrer valor maior do que a média é
igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais
a 0,5. Escrevemos: P(X > 𝑥̅ ) = P(X < 𝑥̅ ) = 0,5.

Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é
obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. Vejamos
como proceder, por meio de um exemplo concreto.
Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina.
Vamos supor que essa variável tenha distribuição normal com média 𝑥̅ = 2 cm e desvio padrão s = 0,04
cm.
Pode haver interesse em conhecer a probabilidade de um parafuso ter um diâmetro com valor entre 2
e 2,05 cm.
É fácil notar que essa probabilidade, indicada por:

P (2 < X < 2,05),

Corresponde à área hachurada na Figura 10.2:

O cálculo direto dessa probabilidade exige um conhecimento de Matemática mais avançado do que
aquele que dispomos no curso de 2° grau. Entretanto, podemos contornar facilmente esse problema.
Basta aceitar, sem demonstração, que, se X é uma variável aleatória com distribuição normal de média
𝑥̅ e desvio padrão s, então a variável:
𝑥 = 𝑥̅
𝑧=
s

tem distribuição normal reduzida, isto é, tem distribuição normal de média O e desvio padrão 1.
As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas, não
havendo necessidade de serem calculadas.
Temos uma de distribuição normal reduzida, que nos dá a probabilidade de Z tomar qualquer valor
entre a média O e um dado valor z, isto é:

𝑃(0 < 𝑍 < 𝑧)

112
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Temos, então, que se X é uma variável aleatória com distribuição normal de média ̅
𝒙 e desvio padrão
s, podemos escrever:
𝑥−𝒙
̅
𝑃 (𝑥̅ < 𝑋 < 𝑥) = 𝑃 (0 < 𝑍 < 𝑧), com 𝑧 = 𝑠

Voltemos, então, ao nosso problema.

Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar,
calcular o valor de z que corresponde a x = 2,05 (x = 2 → z = O, pois 𝑥̅ = 2). Temos, então:

𝑥 − 𝑥̅ 2,05 − 2 0,05
𝑧= = = = 1,25
𝑠 0,04 0,04

donde:
P(2 < X < 2,05) = P(0 < X < 1,25)

Procuremos, agora, z = 1,25, porém para você que irá resolver apenas um exercício na prova, este
valor será dado, mas irei deixar abaixo a tabela onde poderá ser consultado este valor, para nossos
problemas aqui propostos.

Fonte: https://bloglosbifes.files.wordpress.com/2013/10/distribuicao_normal_padrao.png

113
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos, na primeira linha, o valor 5,
que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes
encontramos o valor 0,3944, o que nos permite escrever:

P(0 < Z < 1,25) = 0,3944

Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro entre a
média 𝑥̅ = 2 e o valor x = 2,05 é 0,3944.

Escrevemos, então:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%

Exemplos

1. Determine as probabilidades:
a. P(-1,25 < Z < 0)

A probabilidade procurada corresponde à parte hachurada da figura:

Sabemos que:
P(0 < Z < 1,25) = 0,3944

Pela simetria da curva, temos:

P(-1,25 < Z < 0) = P(0 < Z < 1,25) = 0,3944
b. P(-0,5 < Z < 1,48)

A probabilidade procurada corresponde à parte hachurada da figura:

Temos:
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48)

Como:
P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915

e
P(0 < Z < 1,48) = 0,4306,

obtemos:
P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221
c. P(0,8 < Z < 1,23)

114
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
A probabilidade procurada corresponde à parte hachurada da figura:

Temos:
P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8)

Como:
P(0 < Z < 1,23) = 0,3907 e P(0 < Z < 0,8) = 0,2881,

obtemos:
P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026
d. P(Z > 0,6)

A probabilidade procurada corresponde à parte hachurada da figura:

Temos:
P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6)

Como:
P(Z > 0) = 0,5 e P(0 < Z < 0,6) 0,2258,

obtemos:
P(Z > 0,6) - 0,5 - 0,2258 = 0,2742
e. P(Z < 0,92)

A probabilidade procurada corresponde à parte hachurada da figura:

Temos:
P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92)

115
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Como:
P(Z < 0) = 0,5 e P(0 < Z < 0,92) = 0,3212,

obtemos:
P(Z < 0,92) = 0,5 + 0,3212 = 0,8212

2. Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média de
R$ 500, com desvio padrão de R$ 40. Calcule a probabilidade de um operário ter um salário semanal
situado entre R$ 490 e R$ 520.

Devemos, inicialmente, determinar os valores da variável de distribuição normal reduzida.

Assim:

490 − 500 520 − 500

𝑧1 = = −0,25 𝑒 𝑧2 = = 0,5
40 40

Logo, a probabilidade procurada é dada por:

P(490 < X < 520) = P(-0,25 < Z < 0,5) = P(-0,25 < Z < 0) +
+ P(0 < Z < 0,5) = 0,0987 + 0,1915 = 0,2902

É, pois, de se esperar que, em média, 29,02% dos operários tenham salários entre R$ 490 e R$ 520.

Amostragem por cotas

Neste tipo de amostragem, a população é dividida em grupos, e seleciona-se uma cota proporcional
ao tamanho de cada grupo. Entre- tanto, dentro de cada grupo não é feito sorteio, e sim os elementos
são procurados até que a cota de cada grupo seja cumprida. Em pesquisas eleitorais, a divisão de uma
população em grupos (considerando, por exemplo, o sexo, o nível de escolaridade, a faixa etária e a
renda) pode servir de base para a definição dos grupos, partindo da suposição de que estas variáveis
definem grupos com comportamentos diferenciados no processo eleitoral. Para se ter uma ideia do
tamanho destes grupos, pode-se recorrer a pesquisas feitas anteriormente pelo IBGE (Instituto Brasileiro
de Geografia e Estatística).

Distribuições amostrais

Com as distribuições amostrais, você pode inferir propriedades de um agregado maior (a população)
a partir de um conjunto menor (a amostra), ou seja, inferir sobre parâmetros populacionais, dispondo
apenas de estatísticas amostrais.
Portanto, torna-se necessário um estudo detalhado das distribuições amostrais, que são base para
intervalos de confiança e testes de hipóteses.
Portanto, para que você tenha condições de fazer afirmações sobre um determinado parâmetro
populacional (ex: µ), baseadas na estimativa ̅ 𝒙, obtido a partir dos dados amostrais, é necessário
conhecer a relação existente entre 𝒙 ̅ e µ, isto é, o comportamento de 𝒙 ̅, quando se extraem todas as
amostras possíveis da população, ou seja, sua distribuição amostral.
Para obtermos a distribuição amostral de um estimador, é necessário conhecer o processo pelo qual
as amostras foram retiradas, isto é, se amostras foram retiradas com reposição ou sem reposição.

Portanto, a partir do comportamento da estatística amostral, pode- se aplicar um teorema muito conhecido
na estatística como Teorema do Limite Central. Este teorema propõe que, se retirarmos todas as
possíveis amostras de tamanho n de uma população independente de sua distribuição, e verificarmos
como as estatísticas amostrais obtidas se distribuem, teremos uma distribuição aproximadamente normal,

com µ𝒙̅ = µ (média das médias amostrais igual à média populacional) e variância das médias
(variância das médias mostrais igual à variância da população dividida pelo tamanho da amostra),

se a amostragem for realizada com reposição, ou , se a amostragem for realizada

116
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
sem reposição em uma população finita ( 𝑛⁄𝑁 > 0,05), independentemente da distribuição da variável
em questão.

Considere uma população formada pelos números {1, 2, 3}. Sabemos que esta população apresenta
µ= 2 e variância 2 = 2/3. Retire todas as amostras possíveis com n=2, fazendo com e sem reposição
2
e calcule a média das médias amostrais (µ 2) e a variância das médias amostrais ( Compare
𝑥
com os resultados da população e veja se o teorema é verdadeiro. Pesquise este problema em sites
da internet ou outros livros de Estatística.

Portanto, considerando a distribuição amostral de médias, quando se conhece a variância ou a amostra

é grande (n > 30), utilizamos a estatística z da distribuição normal vista anteriormente, independente da
distribuição da população. Então, por meio do teorema do limite central, a estatística será dada por:

Porém, ocorre que, na prática, muitas das vezes não se conhece 2 e trabalha-se com amostras
pequenas, ou seja, menores ou iguais a 30. Assim, você conhece apenas sua estimativa s (desvio-padrão
amostral). Substituindo por seu estimador s, na expressão da variável padronizada, obtém-se a
variável:

A distribuição t apresenta as seguintes características:

• é simétrica em relação à média, que é zero;
• tem forma campanular (semelhante à normal);
• quando n tende para infinito, a distribuição t tende para a distribuição normal, na prática, a
aproximação é considerada boa quando n >30; e
• possui n-1 graus de liberdade.

Vamos aprender a utilizar a Tabela da distribuição de t de Student. Na Tabela t de Student, na primeira

linha temos o valor de α, que corresponde à probabilidade (área) acima de um determinado valor da
tabela. Na figura a seguir, temos o conceito de α (área mais escura).

Observe que na Tabela de t (a seguir), temos na primeira coluna os graus de liberdade (GL) e no centro
da tabela, teremos os valores da estatística t de Student. Na primeira linha temos os valores de α.

117
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Tabela 8: Limites unilaterais da distribuição t de Student ao nível α de probabilidade
Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimação.ppt

Para exemplificar o uso da tabela, consideremos que desejamos encontrar a probabilidade de ser
maior do que um valor de t igual a 2,764, trabalhando com uma amostra de tamanho n = 11. Portanto,
teremos 10 graus de liberdade e nesta linha procuramos o valor que desejamos encontrar, 2,764. Subindo
na Tabela em direção ao α encontraremos um valor de 0,01 na primeira linha, ou seja, esta é a
probabilidade de ser maior do que 2,764, com 10 graus de liberdade.

Retirando-se uma amostra de n elementos de uma população normal com média µ e variância α2 ,
então, pode-se demonstrar que a distribuição amostral da variância amostral segue uma distribuição de
𝐱 𝟐 (qui-quadrado) com n-1 graus de liberdade. A variável da estatística de qui-quadrado será dada por:

tem distribuição 𝑥 2 com n-1 graus de liberdade.

Esta distribuição é sempre positiva, o que pode ser comprovado pela própria definição da variável.
Esta distribuição é assimétrica, como pode ser visto no gráfico da distribuição mostrado a seguir.

No esquema a seguir, temos como é feita a utilização da distribuição de qui-quadrado com g graus de
liberdade.

118
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimação.ppt

A distribuição F de Snedecor também conhecida como distribuição de Fisher é frequentemente

utilizada na inferência estatística para análise da variância.

Uma variável aleatória contínua tem distribuição de Snedecor com graus de liberdade no
numerador e graus de liberdade no denominador se sua função densidade de probabilidade é definida
por

Neste caso, utilizamos a notação .

O gráfico abaixo ilustra a função densidade da distribuição de Snedecor com parâmetros m = 3 e n =
2.

119
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Exemplo
Um importante exemplo da distribuição de Snedecor corresponde a estatística . Suponha que temos
duas populações independentes tendo distribuições normais com variâncias iguais a .
Considere uma amostra aleatória da primeira população com observações
e uma amostra aleatória da segunda população com observações. Então, a estatística

tem distribuição de Snedecor com graus de liberdade no numerador e graus de

liberdade no denominador, onde e sãos os desvios padrão amostrais da primeira e da segunda
amostra, respectivamente.

Teorema
Considere e variáveis aleatórias com distribuição qui-quadrado com n e m graus de liberdade,
respectivamente. Além disso, suponha que estas variáveis aleatórias são independentes. Então a variável
aleatória:

tem distribuição de Snedecor com m graus de liberdade no numerador e n graus de liberdade no

denominador.

Demonstração
Seja uma variável aleatória positiva com função densidade de probabilidade e uma variável
aleatória com função densidade . Suponha que as variáveis aleatórias e sejam independentes.
Neste caso, a função densidade de probabilidade conjunta é dada por . Considere a
fração . Neste caso, a função densidade conjunta do quociente é dada por

em que . Assim temos que

Considerando a mudança de variável ; temos que:

Assim, a função densidade de probabilidade de é dada por

Como e são independentes, a distribuição conjunta do quociente é dada por

Portanto a distribuição do quociente , com e é dada por:

de onde concluímos que

lembrando que . Fazendo a substituição e reorganizando a integral

acima temos que:

120
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Para finalizar, tomamos e, neste caso, temos que

Ao realizarmos a transformação de variáveis , concluímos que

Ao substituirmos, concluímos que segue uma distribuição com graus de liberdade no numerador
e graus de liberdade no denominador.
Por construção, o quadrado da distribuição t-Student com graus de liberdade tem distribuição F
com grau de liberdade no numerador e graus de liberdade no denominador.

Questões

01. (EBSERH – Analista Administrativo – CESPE/2018) Os tempos de duração de exames de

cateterismo cardíaco (Y, em minutos) efetuados por determinada equipe médica seguem uma distribuição
normal com média µ e desvio padrão σ, ambos desconhecidos. Em uma amostra aleatória simples de 16
tempos de duração desse tipo de exame, observou-se tempo médio amostral igual a 58 minutos, e desvio
padrão amostral igual a 4 minutos.
A partir da situação hipotética apresentada e considerando Φ(2) = 0,977, em que Φ(z) representa a
função de distribuição acumulada de uma distribuição normal padrão e z é um desvio padronizado, julgue
o item que se segue, com relação ao teste de hipóteses H0 = µ ≥ 60 minutos, contra HA = µ < 60 minutos,
em que H0 e HA denotam, respectivamente, as hipóteses nula e alternativa.

Se o teste for efetuado com nível de significância igual a 1%, o poder do teste será igual a 99% para
qualquer valor hipotético µ.
( ) Certo ( )Errado

02. (Polícia Federal – Papiloscopista – CESPE) Com relação a estatística, julgue os itens seguintes.
Suponha que as larguras dos polegares humanos sigam uma distribuição normal com média igual a 2
cm e variância V > 0. Nesse caso, se a probabilidade de se observar um polegar com mais de 2,54 cm
de largura for igual a 0,025, então V será inferior a 0,35.
( ) Certo ( ) Errado

03. (Pref. de São Paulo/SP – Auditor Fiscal do Município – FCC) Considere: Se Z tem distribuição
normal padrão, então:
P(Z < 0,84) = 0,80, P(Z < 1,5) = 0,933, P(Z < 1,96) = 0,975, P(Z < 2,5) = 0,994.

Desejando-se estimar a média µ dos salários de uma população, que deve ser considerada de
tamanho infinito, com desvio padrão conhecido e igual a R$ 100,00, selecionou-se uma amostra aleatória
de 100 elementos da população que forneceu os resultados apresentados na tabela abaixo:

Sabendo que x - y = 2, e utilizando para a estimativa pontual de µ a média aritmética dos 100 salários
apresentados, calculada considerando que todos os valores incluídos num intervalo de classe são
coincidentes com o ponto médio do intervalo, um intervalo de confiança para µ, com coeficiente de
confiança de 95%, é, em reais, dado por

121
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
(A) [3410,40; 3449,60]
(B) [3409,40; 3450,60]
(C) [3400,40; 3439,60]
(D) [3420,60; 3459,40]
(E) [3410,00; 3450,00]
04. A análise de uma amostra de sangue produziu os seguintes resultados para colesterol: 241, 243,
245 e 247 mg/dL. Considere que a distribuição dos dados tende à normalidade com t = 4,5 para 3 graus
de liberdade e com 98% de limite de confiança e que o desvio padrão dos resultados é 2,6. Considerando
o valor médio e o intervalo de confiança do resultado, o valor mais próximo da maior concentração
admitida para o colesterol na amostra é
(A) 242,2
(B) 244,0
(C) 246,6
(D) 249,0
(E) 249,9
05. (SEFAZ/SP – Agente Fiscal de Rendas – FCC) Espera-se que o número de reclamações
tributárias em um órgão público durante determinada semana seja igual a 25, em qualquer dia útil. Sabe-
se que nesta semana ocorreram 125 reclamações com a seguinte distribuição por dia da semana:

Para decidir se o número de reclamações tributárias correspondente não depende do dia da semana,
a um nível de significância ?, é calculado o valor do qui-quadrado (?²) que se deve comparar com o valor
do qui-quadrado crítico tabelado com 4 graus de liberdade. O valor de ?² é
(A) 1,20
(B) 1,90
(C) 4,75
(D) 7,60
(E) 9,12
Comentários
01. Resposta: Errado.
O poder de um teste estatístico é a probabilidade de rejeitar a hipótese nula ( H0), quando a hipótese
alternativa é verdadeira. O poder do teste é calculado como 1- B e também pode ser interpretado com a
probabilidade de rejeitar corretamente um hipótese nula falsa

02. Resposta: Certo.

Para a distribuição normal existe uma fórmula que é Z = (X - µ)/ V, onde X é o número da observação,
µ é a média e V é o desvio-padrão.
Preenchendo a fórmula com os dados da questão temos: Z = (2,54 - 2)/ V
Sabendo de cor ou olhando na tabela da área sobre a curva normal padronizada de 0 a Z, a
probabilidade que pede a questão Pr = 0,025 indica o Z = 1,96.
Substituindo na fórmula para encontrar o desvio-padrão (V), encontramos agora: 1,96 = 0,54/ V
V = 0,54/ 1,96 = 0,27551020... que é inferior a 0,35

03. Resposta: E.
Para calcular o Intervalo de Confiança (IC), devemos utilizar a fórmula:
IC: µ ± Zα/2 * δ/ n^1/2
Em que:
µ = média de X;
Z2,5% = 1,96 (o teste é normal, pois o desvio padrão é conhecido...além disso a distribuição é
bicaudal, visualizando que o intervalo de confiança abrange os valores: X - µ < µ < X + µ da distribuição
Normal); -> Ver tabela P (-Zi < Z < +Zi)
δ = 100 (desvio padrão populacional);
n = 100 amostras

Assim: IC = µ ± 1,96 * 100/100^1/2 = µ ± 19,6

122
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Resta calcular a média populacional de X
µ = E(X) = ∑Xi*pi
Xi = Valores no ponto médio (variável estudada é o salário ganho dos servidores)
X1 = 2k
X2 = 3k
X3 = 4k
X4 = 5k
E(X) = X1*p1 + X2* p2 + X3*p3 + X4*p4
Calculando as frequências relativas, sabendo que: X = Y +2
Sabe-se que a soma de todas as frequências relativas (Pi) = 100
Portanto: p1 + p2 + p3 + p4 = 100
(Y + 2) + (Y + 17) + (Y + 9) + Y = 100
4Y + 28 = 100
4Y = 72
y= 18
x= 20
Retomando ao cálculo de E(X):
E(X) = 2k*0,2 + 3k * 0,35 + 4k * 0,27 + 5k * 0,18
E(X) = 0,4k + 1,05k + 1,08k + 0,90k
E(X) = 3,430k reais = 3430 reais

Finalmente: IC = 3430 ± 19,60 = [3410,4 ; 3449,60]

04. Resposta: E.
A mediana é (243+245)/2 = 244. A média é (241+243+245+247)/4 = 244
Esse valor é igual a valor médio + t[98%,3 graus de liberdade]*desvio-padrão/raiz(3)
=244+4,5*2,6/raiz(3) = 244 + 11,7/1,73 = 250,755

05. Resposta: D.
O valor do teste é baseado nas diferenças entre as frequências observadas e esperadas. Elevamos a
diferença ao quadrado, dividimos pelas frequências esperadas, e somamos.

4 Análise de regressão linear. 4.1 Critérios de mínimos quadrados e de máxima

verossimilhança. 4.2 Modelos de regressão linear. 4.3 Inferência sobre os
parâmetros do modelo. 4.4 Análise de variância. 4.5 Análise de resíduos.

REGRESSÃO LINEAR SIMPLES

Em estatística ou Econometria, regressão linear é um método para se estimar a condicional (valor

esperado) de uma variável y, dados os valores de algumas outras variáveis x. A regressão, em geral,
trata da questão de se estimar um valor condicional esperado.
A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é
uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos
parâmetros se chamam modelos de regressão não-linear.

Equação da Regressão Linear: Para se estimar o valor esperado, usa-se de uma equação, que
determina a relação entre ambas as variáveis.

Em que: Yi - Variável explicada (dependente); é o valor que se quer atingir;

α - É uma constante, que representa a interceptação da reta com o eixo vertical;
β - É outra constante, que representa o declive da reta;
Xi - Variável explicativa (independente), representa o factor explicativo na equação;
εi - Variável que inclui todos os factores residuais mais os possíveis erros de medição. O seu
comportamento é aleatório, devido à natureza dos factores que encerra. Para que essa fórmula possa

123
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
ser aplicada, os erros devem satisfazer determinadas hipóteses, que são: serem variáveis normais, com
a mesma variância (desconhecida), independentes e independentes da variável explicativa X.

Critérios de mínimos quadrados e de máxima verossimilhança

O primeiro passo na análise de regressão é obter as estimativas e dos parâmetros do modelo. Os
valores dessas estimativas serão obtidos a partir de uma amostra de n pares de valores , i=1,...,n
que correspondem a n pontos em um gráfico, como na Figura 1.2.1. No método de Mínimos Quadrados,
não é necessário conhecer a forma da distribuição dos erros.
Suponha que é traçada uma reta arbitrária passando por esses pontos. No valor da variável
explicativa, o valor predito por esta reta é , enquanto o valor observado é . Os desvios (erros)
entre estes dois valores é , que corresponde a distância vertical do ponto à reta
arbitrária.
O objetivo é estimar os parâmetros e de modo que os desvios ( ) entre os valores observados e
estimados sejam mínimos. Isso equivale a minimizar o comprimento do vetor de erros,
.
Considerando n pares de valores observados ,

Cálculo dos fatores α e β:

Definindo e , temos que e se relacionam por:

Desenvolvimento: Estas fórmulas podem ser desenvolvidas a partir da definição de mínimos

quadrados. O objectivo é determinar α e β de forma que a soma dos quadrados dos erros seja mínima,
ou seja, devemos minimizar.

124
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Desenvolvendo este quadrado e eliminando os termos constantes (ou seja, aqueles que não têm
termos em α e β, chega-se a:

A partir desse ponto, pode-se resolver usando-se cálculo (tomando as derivadas parciais, etc), ou
através de uma transformação de coordenadas:

Transformando a expressão a ser minimizada em:

Esta expressão se separa na soma de duas expressões quadráticas independentes, que podem ser
minimizadas usando matemática elementar:

Cujos valores minimizadores são:

Memorização:

Uma forma fácil de memorizar esta expressão é escrever:

Y = α + Xβ
XY = Xα + X2β
e, em seguida, somar as colunas:

Intervalos de confiança:

O valor estimado de , , deve ser analisado através da distribuição t de Student, porque

125
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
tem a distribuição t de Student com n-2 graus de liberdade (ver Fisher, R. A. (1925). "Applications of
"Student's" distribution". Metron 5: 90–104.), em que:

A variância de , pode ser estimada através dos erros observados:

se distribui como uma Chi quadrado com n-2 graus de liberdade.

ANÁLISE SE VARIÂNCIA

A análise de variância é baseada na decomposição da soma de quadrados. Em outras palavras, o desvio

de uma observação em relação à média pode ser decomposto como o desvio da observação em relação
ao valor ajustado pela regressão mais o desvio do valor ajustado em relação à média, isto é, podemos
escrever como

Soma dos quadrados

Elevando cada componente de (1.3.1) ao quadrado e somando para todo o conjunto de observações,
obtemos

em que

Desta forma, escrevemos

em que decompomos a Soma de Quadrados Total em Soma de Quadrados da Regressão e Soma de

Quadrados dos Erros.

Partição dos graus de liberdade

Assim como temos a decomposição da soma de quadrados total, vamos derivar uma decomposição para
os graus de liberdade. ë importante ressaltarmos que os graus de liberdade são definidos como a
constante que multiplica para definir o valor esperado da soma de quadrados,
temos que . Assim, os graus de liberdade relacionado com a é dado por
.
Agora, sob , temos que é uma amostra aleatória simples de uma população com
média e variância , temos que . Então, como a soma de quadrados total foi
decomposta na soma de quadrados dos erros mais a soma de quadrados da regressão, concluímos que
sob ,

126
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Com isso, concluímos que a tem um grau de liberdade.
Assim, sob , obtemos a seguinte decomposição dos graus de liberdade:
(1) tem graus de liberdade;
(2) tem grau de liberdade;
(3) tem graus de liberdade.
De forma geral, não necessariamente sob , também podemos calcular facilmente o valor esperado da
soma de quadrado total. Para isto, temos que

Concluímos que

Da mesma forma, temos que

Portanto, obtemos que

Observe que sob , obtemos que . Por outro lado, o valor esperado do quadrado
médio da regressão é dado por,

Quadrado Médio

A ideia básica do quadrado médio está em tornarmos as somas de quadrados comparáveis. Sabemos
que, sob , os graus de liberdade são constantes que vem multiplicando o no cálculo do valor
esperado da soma de quadrados.

Sob , tanto o quadrado médio dos erros (QME) quanto o quadrado médio da regressão (QMR)
são estimadores de momento para . Portanto, eles são comparáveis.
A seguir, apresentamos algumas formas simplificados para o cálculo das somas de quadrados.

Além disso,

127
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Desta forma,

e portanto,

ANÁLISE DE RESÍDUOS

Tanto na Regressão Linear Simples quanto na Regressão Múltipla, as suposições do modelo ajustado
precisam ser validadas para que os resultados sejam confiáveis. Chamamos de Análise dos
Resíduos um conjunto de técnicas utilizadas para investigar a adequabilidade de um modelo de
regressão com base nos resíduos.
o resíduo é dado pela diferença entre a variável resposta observada e a variável resposta
estimada , isto é

A ideia básica da análise dos resíduos é que, se o modelo for apropriado, os resíduos devem refletir
as propriedades impostas pelo termo de erro do modelo. Tais suposições são

em que com
i. e são independentes ;
ii. (constante);
iii. (normalidade);
iv. Modelo é linear;
v. Não existir outliers (pontos atípicos) influentes.

Na Regressão Múltipla, além das suposições listadas acima, precisamos diagnosticar colinearidade e
multicolinearidade entre as variáveis de entrada para que a relação existente entre elas não interfira nos
resultados, causando inferências errôneas ou pouco confiáveis.

As técnicas utilizadas para verificar as suposições descritas acima podem ser informais (como
gráficos) ou formais (como testes). As técnicas gráficas, por serem visuais, podem ser subjetivas e por
isso técnicas formais são mais indicadas para a tomada de decisão. O ideal é combinar as técnicas
disponíveis, tanto formais quanto informais, para o diagnóstico de problemas nas suposições do modelo

CORRELAÇÃO

Diz-se que existe correlação entre duas ou mais variáveis quando as alterações sofridas por uma delas
são acompanhadas por modificações nas outras. Ou seja, no caso de duas variáveis x e y os aumentos
(ou diminuições) em x correspondem a aumentos (ou diminuições) em y. Assim, a correlação revela se
existe uma relação funcional entre uma variável e as restantes. Note-se que a palavra regressão em
Estatística corresponde à palavra função em Matemática. Ou seja, enquanto o matemático diz que y é
função de x, o estatístico fala em regressão de y sobre x.

128
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Reta de regressão

Uma função muito interessante é a que representa a linha reta, cuja expressão matemática é

y = a + bx em que
y= variável dependente
x= variável independente
a= constante = intercepto (ponto em que a reta corta o eixo
dos y)
b= constante = coeficiente de regressão

sendo que o intercepto a pode ser calculado a partir de: a = y – b . x

Ressalte-se que necessariamente o ponto determinado pela média das variáveis está contido na reta.
A melhor reta que descreve a regressão. Supondo uma amostra em que um caráter métrico tenha a
seguinte distribuição de idades e larguras de um órgão:

Idade Largura
(x) (y)
1 30 Em que:
2 40 total de larguras = 520
3 50 total de idades = 36
4 60
5 70 média de larguras = 65
6 80 média de idades = 4,5
7 90
8 100 Supondo a = 20 e b =
10

Quando se deseja desenhar uma reta, para facilitar, atribui-se 2 valores de x próximos aos extremos
dos dados. Depois, usa-se esses valores na equação: y = y + b.(x - x) . Portanto, para a idade x = 1 ano,
largura: y = 65 + 10 (1 - 4,5) = 30 para a idade x = 8 anos, largura: y = 65 + 10 (8 - 4,5) = 100

E chega-se ao seguinte gráfico:

Essa reta, que passa pelos pontos médios dos valores de x e y é a melhor reta que descreve a
regressão. Evidentemente, pode-se usar o mesmo processo em gráficos feitos em programas
computacionais.

129
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Proporcionalidade: Direta e Inversa
Quando se observa o coeficiente de regressão b e o sentido da reta pode-se concluir se existe
correlação entre as variáveis e qual é o sentido da correlação. Nesse caso, verifica-se que a aumentos
na variável Idade (x) correspondem aumentos na variável Largura do órgão (y). Assim sendo, elas têm o
mesmo sentido de variação. Essa é uma correlação positiva. Evidentemente, uma correlação será
negativa quando a aumentos na variável x corresponderem diminuições na variável y. Nesse caso, as
variáveis estudadas variam em sentidos opostos.
Paralelamente, percebe-se que quando a reta de regressão em y é paralela ao eixo dos x (b = 0) não
há correlação. Portanto, para que exista correlação é necessário que a reta corte o eixo dos x em algum
ponto (b ≠ 0). Assim, quando há correlação, a reta de regressão em y não é paralela ao eixo dos x.
Interpolação x Extrapolação

É importante distinguir a consistência dos modelos considerando-se a diferença entre:

Interpolação: predição dentro da amplitude dos dados amostrados.
Extrapolação: predição fora da amplitude dos dados.

Existe correlação?
Para se decidir sobre a existência de correlação e o sentido da variação da reta de regressão, calcula-
se b e o erro de b. Depois efetua-se um teste t, testando as seguintes hipóteses:
H0 : b = 0, ou seja, H. Nula: a reta de regressão em y é paralela ao eixo dos x.
Ha : b ≠ 0, isto é, H. Alternativa: a reta de regressão em y não é paralela ao eixo dos x.

Como calcular
Recordando que as somatórias de quadrados (SQ) e de produtos (SP) são calculadas por:
SQx = x2 – [( x)2 / n]
SQy = y2 – [( y)2 / n]
SP = (x.y) – n.x.y

O coeficiente de regressão, b, pode ser calculado a partir de várias fórmulas:

b = [(x – x) (y – y)] / (x – x)2
ou
b = ( (x.y) – n.x.y) / x2 – [( x)2 /n]
ou
b = SP / SQx

O erro de b também pode ser calculado de maneiras diferentes:

sb = raiz (syx / SQy) ou
sb = raiz {(SQy – b.SP) / [SQx (n – 2)]}

Para se testar a significância de b, ou seja, para testar se b pode ser considerado ou não como
significativamente diferente de zero, calcula-se t, com GL = n - 2, sendo: t = b / sb

Para encontrar o t crítico, consulta-se a tabela de t, e obedece-se o seguinte critério:

t < tc tc t > tc
t não é significativo t é significativo
b não é significativamente b é significativamente diferente
diferente de 0 de 0
(a reta é paralela ao eixo dos x) (a reta não é paralela ao eixo
dos x)

Portanto:

1. Se t não for significativo os caracteres não estão correlacionados: (t = 0)

Se t for significativo os caracteres estão correlacionados: (t ≠ 0)

130
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
2. Sendo t ≠ 0, se b < 0 a correlação é negativa. Os caracteres variam em sentidos opostos.
Sendo t ≠ 0, se b > 0 a correlação é positiva. Os caracteres variam no mesmo sentido.

ausência de correlação positiva correlação

correlação negativa
t = 0, qualquer b t ≠ 0, b > 0 t ≠ 0, b < 0
Não há sentido de As variáveis variam As variáveis variam
variação no mesmo sentido em sentidos
opostos

Exemplo: Os seguintes dados foram obtidos amostrando dimensões do mesmo órgão de 10 indivíduos.

comprimento x 40 25 65 75 65 40 50 40 15 25
largura y 25 15 50 65 50 25 40 40 15 15

que geraram os seguintes valores:

x 440 y 340 n 10
x 44 y 34 (x.y) 17950

x2 22850 y2 14350 n.x.y 14960

x2 / n 19360 y2 / 11560 SP 2990

n
SQx 3490 SQy 2790 SP2 8940100
s2x 387,78 s2y 310

Coeficiente de correlação linear de Pearson ( r )

Pode ser obtido a partir de diferentes fórmulas:

r= n . (x.y) - ( x) ( y) / raiz [n. x2 - ( x)2 ] [ n. y2 - (

y)2 ]
r= ( (x.y) - n.x.y ) / [( n - 1).𝛿x. 𝛿y]
r= raiz ( b.SP / SQy )
r= b.( 𝛿x /𝛿y)

Observando as duas últimas fórmulas rapidamente percebe-se que se não houver correlação entre x
e y, ou seja, se r = 0, então b = 0 e a reta será paralela ao eixo dos x. O coeficiente r varia entre -1 e +1.
Portanto, a correlação pode ser:

-1 - -0,50 - 0 0,10 0,50 +0,95 +1

0,95 0,10
neg neg neg neg ausência pos pos pos pos
perfeita forte moderada fraca fraca moderada forte perfeita

Para testar a significância usamos um teste t. Estabelecemos as hipóteses:

H0 : r = 0 , ou seja, H. Nula: Não há correlação entre as variáveis x e y.
Ha : r ≠ 0, isto é, H. Alternativa: Há correlação entre as variáveis x e y.
Calcula-se t, com GL = n - 2, por meio da seguinte fórmula: t = r . raiz [(N - 2) / (1 - r2 )]

131
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Coeficiente de determinação
O coeficiente de determinação é simbolizado por r2 e indica quanto da variação total é comum aos
elementos que constituem os pares analisados. Assim, a qualidade da regressão é indicada por este
coeficiente.

r2 = Variação explicada de Y / Variação total de Y

É importante notar que r2 varia entre 0 (zero) e 1 (um). Evidentemente, quanto mais próximo da unidade
for o coeficiente de Determinação, tanto maior será a validade da regressão.

Exemplo 1: Supondo que numa certa amostra tivessem sido obtidos os seguintes valores:
b = 0,86; SP = 2990; SQy = 2790

Estima-se r = raiz ( b.SP / SQy ), r = raiz ( 0,86.2990 / 2790), r = 0,96

Portanto, r2 = 0,92
1 - 0,92 = 0,08, ou seja 8%

Assim, pode-se dizer que apenas 8% da variância da regressão não depende das variáveis estudadas.

Exemplo 2: Dados obtidos de 7 pares de pai-filho, amostrando o número de anos de escola cursados
pelo pai (x) e o número de anos de escola cursados pelo filho (y). Qual é o valor do coeficiente de
correlação entre esses dados? Qual é o seu significado?

x x2 y y2 x.y
12 144 12 144 144
10 100 8 64 80
6 36 6 36 36
16 256 11 121 176
8 64 10 100 80
9 81 8 64 72
12 144 11 121 132
x= x2 = 825 y = 66 y2 = 650 (x.y) = 720
73

r = N . xy - ( x) ( y) /raiz [ N. x2 - ( x)2 ] [ N. y2 - ( y)2 ]

r = 7 . 720 - 73 . 66 / raiz [ 7 . 825 - (73)2 ] [ 7 . 650 - (66)2 ]
r = + 0,754

Para testar a significância usamos um teste t. Estabelecemos as hipóteses:

H0 : r = 0 e Ha : r ≠ 0
t = r . raiz [(N - 2) / (1 - r2 )]

t = [+ 0,754. raiz[(7-2)] / (1 - 0,7542 )], portanto, t = 2,581

Verificando a tabela de t, com GL = 5 e a = 5%, t 5 = 2,571

Conclui-se que como t calculado é maior que tc, pode-se rejeitar a hipótese nula (r = 0) e aceitar a
hipótese alternativa em que r ≠ 0, admitindo-se que o número de anos de escola cursados pelo pai está
positivamente correlacionado (r = + 0,754) ao número de anos de escola cursados pelo filho nesta
amostra.
Como r2 = 0,5685 e 1 - 0,5685 = 0,4315, pode-se dizer que nessa amostra, o número de anos de
escola cursados pelo pai explica 56,85% da variância do número de anos de escola cursados pelo filho.
Assim, 43,15% da variância da regressão depende de outras variáveis, não estudadas aqui.

Coeficiente de associação
Para verificar se dois caracteres qualitativos são interdependentes pode-se:
- empregar um teste de x2.
- calcular o coeficiente de associação.

132
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Yule propôs esse coeficiente e o chamou de Q, para homenagear um pioneiro da Estatística, Lambert
A. J. Quételet (1796-1874). Monta-se uma tabela 2 x 2 e designa-se as células pelas letras a, b, c e d,
ficando a-d e b-c nas diagonais.

a b
c d

Obtém-se o coeficiente de associação Q por meio de:

Q = (ad - bc) / (ad + bc)

O desvio padrão de Q é obtido por:

s = (1 - Q2 ) / 2 raiz (1/a + 1/b + 1/c +1/d)

O intervalo de confiança de 95% de Q é obtido por:

Q ± t.s

Exemplo: Supondo que a distribuição de 200 pacientes adultos (92 homens e 108 mulheres) segundo
as formas maligna e benigna de uma doença foi:

Forma / Homens Mulheres Total

Sexo
Maligna 60 a 40 b 100
Benigna 32 c 68 d 100
Total 92 108 200

Q = (ad - bc) / (ad + bc) = (60 x 68) - (40 x 32) / (60 x 68) + (40 x 32)
Q = (4080 - 1280) / ( 4080 + 1280 ) = 2800 / 5360
Q = 0,5224

O desvio padrão de Q é obtido por:

s = (1 - Q2 ) / 2 . raiz (1/a + 1/b + 1/c +1/d)
s = (1 - 0,52242 ) / 2 . raiz (1/60 + 1/40 + 1/32 +1/68)
s = 0,3635 . raiz (0,0167 + 0,0250 + 0,0312 + 0,01470)
s = 0,3635 . raiz 0,0876 = 0,3635 . 0,2960 = 0,1076

O intervalo de confiança de 95% de Q é obtido por:

Q ± t.s = 0,5224 ± 1,96 x 0,1076

Portanto, o valor mínimo é 0,3115 e o valor máximo é 0,7333.

Como o valor calculado de Q (0,5224 ) se encontra entre esses 2 valores (,3115 e 0,7333), conclui-se
que existe associação entre o sexo e as formas da doença, estando o sexo masculino associado à forma
maligna, pois nesse sexo há maior frequência dessa forma.

Questões

01. (SEAD/AP – Fiscal da Receita Estadual – FGV) Se no ajuste de uma reta de regressão linear
simples de uma variável Y em uma variável X o coeficiente de determinação observado foi igual a 0,64,
então o módulo do coeficiente de correlação amostral entre X e Y é igual a:
(A) 0,24
(B) 0,36
(C) 0,50
(D) 0,64
(E) 0,80

02. Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição
de um aditivo (X). Para isto, foram realizados ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de aditivo.
Os resultados seguem.

133
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Calcule a equação de regressão.

03. (Colégio Pedro II – Estatístico – IDECAN) As quantidades a seguir foram obtidas a partir de uma
amostra de 60 indivíduos com relação a duas características: X e Y.

O coeficiente de correlação amostral entre x e y é igual a

(A) 0,013.
(B) 0,780.
(C) 0,805.
(D) 0,911.
(E) 0,970.

Respostas

01. Resposta: E.
Numa regressão, o coeficiente de determinação é R² e o coeficiente de correlação é R. Foi dito que R²
= 0,64, o que resulta R = 0,80.

02.

6.(1754,3)−(21).(496,8) 93
Β= 6.(91)−(21)²
= 105
= 0,886

496,8−(0,886).(21)
α= 6
= 79,7

y = 79,7 + 0,886x.

03. Resposta: D.
66
Coef. de correlação = = 0,911
√82 . 64

134
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
5 Técnicas de amostragem: amostragem aleatória simples, estratificada,
sistemática e por conglomerados. 5.1 Tamanho amostral.

AMOSTRAGEM

Amostragem é um técnica especial para recolher amostras, que garante, tanto quanto possível, o
acaso na escolha.

Probabilística (aleatória): A probabilidade de um elemento da população ser escolhido é conhecida.

Cada elemento da população passa a ter a mesma chance de ser escolhido.
Não-probabilística (não aleatória): Não se conhece a probabilidade de um elemento ser escolhido
para participar da amostra.

No quadro abaixo está descrita os métodos de amostragem:

AMOSTRAGEM PROBABILÍSTICA

Amostragem casual ou aleatória simples: este tipo de amostragem se assemelha ao sorteio lotérico.
Ela pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um
dispositivo aleatório qualquer, k números dessa sequência, os quais serão pertentes à amostra.
Exemplo: 15% dos alunos de uma população de notas entre 8 e 10, serão sorteados para receber uma
bolsa de estudos de inglês.

Vantagens Desvantagens
- Facilidade de cálculo estatístico; - Requer listagem da população;
- Probabilidade elevada de compatibilidade dos - Trabalhosa em populações elevadas;
dados da amostra e da população. - Custos elevados se a dispersão da amostra for
elevada.

Amostragem sistemática: escolher cada elemento de ordem k. Assemelha-se à amostragem

aleatória simples, porque inicialmente enumeram-se as unidades da população. Mas difere da aleatória
porque a seleção da amostra é feita por um processo periódico pré-ordenado. Os elementos da população
já se acham ordenados, não havendo necessidade de construir um sistema de referência.
Exemplo: Amostra de 15% dos alunos com déficit de atenção diagnosticado. Sorteia-se um valor de 1
a 5. Se o sorteado for o 2, incluem-se na amostra o aluno 2, o 7, o 12 e assim por diante de cinco em
cinco.

Amostragem proporcional estratificada: muitas vezes a população se divide em subpopulações –

estratos, então classificamos a população em, ao menos dois estratos, e extraímos uma amostra de cada
um. Podemos determinar características como sexo, cor da pele, faixa etária, entre outros.

135
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Exemplo: Supondo que dos noventa alunos de uma escola, 54 sejam meninos e 36 sejam meninas
vamos obter a amostra proporcional estratificada de 10% desta população.
Temos dois estratos: sexo masculino e feminino.

Sexo População 10% Amostra

10𝑥54
M 54 = 5,4 5
100
10𝑥36
F 36 = 3,6 4
100
10𝑥90
Total 90 = 9,0 9
100

Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem aos meninos e de 55 a 90, as

meninas.
Para amostragem muito grande também fazemos o uso da Tabela de Números Aleatórios, elaborada
a fim de facilitar os cálculos, que foi construída de modo que os dez algarismos (0 a 9) são distribuídos
ao acaso nas linhas e colunas, conforme pode ser visto abaixo:

Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da

mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme nossa
necessidade. Os números obtidos irão indicar os elementos da amostra.
No nosso exemplo vamos definir como critérios a primeira e a segunda colunas da esquerda, de cima
para baixo (constituídos de 2 algarismos), obtermos os seguintes números.
A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou vice versa),
verticalmente (de cima para baixo ou vice versa), diagonalmente (no sentido ascendente ou
descendente), formando desenho de alguma letra e até mesmo escolhendo uma única linha ou coluna.
O critério adotado deve ser definido antes do início do processo.

57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Eliminamos os números maiores que 90 e os números repetidos.

136
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Assim temos:
28 22 53 18 03 – para os meninos;
57 90 80 56 – para as meninas.

Vantagens Desvantagens
- Pressupõe um erro de amostragem menor; - Necessita de maior informação sobre a
- Assegura uma boa representatividade das população;
variáveis estratificadas; - Cálculo estatístico mais complexo.
- Podem empregar-se metodologias diferentes
para cada estrato;
- Fácil organização do trabalho de campo.

Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos

(conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente
algumas dessas seções e tomamos todos os elementos das mesmas.
Exemplo:

O mapa mostra os conglomerados selecionados (neste caso os municípios), que apresentaram a maior
proporção de casos de dengue confirmados no Estado de São Paulo até março de 2015.

Vantagens Desvantagens
- Não existem listagem de toda a população; - Maior erro de amostragem;
- Concentra os trabalhos de campo num número - Cálculo estatístico mais complexo na estimação
limitado de elementos da população. do erro de amostragem.

AMOSTRAGEM NÃO-PROBABILÍSTICA

Amostragem por cotas: consiste em uma amostragem por julgamento que ocorre em suas etapas.
Em um primeiro momento, são criadas categorias de controle dos elementos da população e, a seguir,
selecionam-se os elementos da amostra com base em um julgamento.

Amostragem por julgamento: quando o pesquisador seleciona os elementos mais representativos

da amostra de acordo com seu julgamento pessoal. Essa amostragem é ideal quando o tamanho da
população é pequeno e suas características, bem conhecidas.

Amostragem por conveniência: é uma amostra composta de indivíduos que atendem os critérios de
entrada e que são de fácil acesso do investigador. Para o critério de seleção arrolamos uma amostra
consecutiva.
Exemplo: Em uma pesquisa sobre dengue, arrolar os 200 pacientes que receberam diagnostico em
um hospital.

137
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
Vantagens Desvantagens
- Mais econômica; - Maior erro de amostragem que em amostras
- Fácil administração; aleatórias;
- Não necessita de listagem da população. - Não existem metodologias válidas para o cálculo
do erro de amostragem;
- Limitação representativa;
- Maior dificuldade de controle de trabalho de
campo

Tamanho da Amostra
O tamanho da amostra deve ser determinado antes de se iniciar a pesquisa.
Deve-se usar a maior amostra possível, pois quanto maior a amostra, maior a representatividade da
população. Amostras menores possuem resultados menos precisos.
É muito importante usarmos amostras de tamanhos adequados, para que os dados tenham maior
confiabilidade e precisão.
Consideramos:

Amostras grandes: n > 100

Amostras médias: n > 30
Amostras pequenas: n < 30
Amostras muito pequenas: n < 12

Erros de amostragem
Diferença randômica(aleatória) entre a amostra e população da qual a amostra foi retirada. O tamanho
do erro pode ser medido em amostras probabilísticas, expressa como “erro padrão” (ou precisão) de
média, proporção entre outros.
Erro padrão da média: é usado para estimar o desvio padrão da distribuição das médias amostrais,
tanto para populações finitas ou infinitas (será abordado em medidas de dispersão).
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2004.
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999.
DORA, Filho U – Introdução à Bioestatística para simples mortais – São Paulo – Elsevier: 1999.
http://www.andremachado.org

Questões

01. (TRT/MG – Analista Judiciário – FCC) O objetivo de uma pesquisa era o de se obter,
relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda
familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível
educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores
para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda
familiar foram, respectivamente,
(A) censo e amostragem por conglomerados.
(B) amostragem aleatória e amostragem sistemática.
(C) censo e amostragem casual simples.
(D) amostragem estratificada e amostragem sistemática.
(E) amostragem sistemática e amostragem em dois estágios.

02. (EPE – Analista de Pesquisa Energética – CESGRANRIO) Considere um planejamento amostral

para uma população de interesse no qual é feita uma divisão dessa população em grupos idênticos à
população alvo, como uma espécie de microcosmos da população, e, em seguida, seleciona-se
aleatoriamente um dos grupos e retira-se a amostra do grupo selecionado.
A técnica de amostragem descrita acima é definida como:
(A) amostragem aleatória simples
(B) amostragem por conglomerados
(C) amostragem estratificada
(D) amostragem sistemática
(E) amostragem por cotas

138
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS
03. (MTur – Estatístico – ESAF) Com relação à amostragem, pode-se afirmar que:
(A) na amostragem por quotas, tem-se uma amostra não probabilística na qual divide-se a população
em subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos
individuais obedece o critério de uma amostra sistemática.
(B) na amostragem estratificada, divide-se a população em grupos (ou classes, ou estratos), de modo
que os elementos pertencentes ao mesmo estrato sejam o mais heterogêneos possível com respeito à
característica em estudo. Para cada grupo toma-se uma subamostra pelo procedimento a.a.s., e a
amostra global é o resultado da combinação das subamostras de todos os estratos
(C) na amostragem por conglomerados, seleciona-se primeiro, ao acaso, grupos (conglomerados) de
elementos individuais da população. A seguir, toma-se ou todos os elementos ou uma subamostra de
cada conglomerado. Nos conglomerados, as diferenças entre eles devem ser tão grandes quanto
possível, enquanto as diferenças dentro devem ser tão pequenas quanto possível.
(D) na amostragem por quotas, tem-se uma amostra probabilística na qual divide-se a população em
subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos individuais
é por sorteio.
(E) na amostragem sistemática, toma-se cada k-ésima unidade da população previamente ordenada,
em que k é a razão de amostragem. O procedimento deve começar ao acaso, sorteando-se um número
entre 1 e k.

04. (TJ-ES – Analista Jurídico – CESPE) No que concerne aos planos amostrais, julgue os itens a
seguir.

Tanto na amostragem estratificada quanto na amostragem por conglomerados, a população é dividida

em grupos. Na amostragem por conglomerados, de cada grupo seleciona-se um conjunto de elementos;
na amostragem estratificada, devem-se selecionar quais estratos serão amostrados e, desses, observar
todos os elementos.
( ) Certo ( ) Errado

Respostas

01. Resposta: C.
Vide a definição apresentada em nosso material.

02. Resposta: B.
Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos
(conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente
algumas dessas seções e tomamos todos os elementos das mesmas.

03. Resposta: E.
Escolher cada elemento de ordem k. Assemelha-se à amostragem aleatória simples, porque
inicialmente enumeram-se as unidades da população. Mas difere da aleatória porque a seleção da
amostra é feita por um processo periódico pré-ordenado. Os elementos da população já se acham
ordenados, não havendo necessidade de construir um sistema de referência.

04. Resposta: Errado.

As definições de amostragem estratificada e por conglomerados estão invertidas.

139
1660225 E-book gerado especialmente para MEL CAUA MAIA SANTOS