ESTATÍSTICA DESCRITIVA
Estatística Descritiva
A estatística descritiva é um ramo da estatística que aplica várias técnicas para descrever e sumarizar
um conjunto de dados. Diferencia-se da estatística inferencial, ou estatística indutiva, pelo objetivo:
organizar, sumarizar dados ao invés de usar os dados em aprendizado sobre a população. Esse prin-
cípio faz da estatística descritiva independente.
Algumas medidas que são normalmente usadas para descrever um conjunto de dados são medidas de
tendência central e medidas de variabilidade ou dispersão. Medidas de tendência central incluem mé-
dia, mediana e moda. Medidas de variabilidade incluem desvio padrão, variância, o valor máximo e
mínimo, obliquidade e curtose.
Uso em Análise Estatística
A Estatística descritiva fornece resumos simples sobre a amostra e sobre as observações que foram
feitas. Tal resumo pode ser quantitativo ou visual. Esses resumos tanto podem formar a base da des-
crição inicial dos dados, como parte de uma análise estatística mais extensa, ou eles podem ser sufici-
entes por si mesmos.
Por exemplo, a porcentagem de arremessos no basquetebol é uma descrição estatística que resume a
performance de um jogador ou time. Esse número é a quantidade de arremessos bem-sucedidos divi-
dido pelo o número de arremessos.
Por exemplo, um jogador que consegue porcentagem de 33% faz aproximadamente um arremesso
bem-sucedido em cada três arremessos. A porcentagem descreve ou resume múltiplos eventos discre-
tos. Considere também a média da nota escolar. Esse número descreve a performance geral de um
estudante em um curso.
O uso de descrição e resumo estatísticos tem uma história intensiva e, de fato, a simples tabulação de
populações e dados económicos foram a primeira forma em que a estatística apareceu.
Mais recentemente, umas colecção de técnicas de resumos apareceram com o título de análise explo-
ratória de dados, um exemplo dessas técnicas é o diagrama de caixa.
No mundo dos negócios, estatística descritiva fornece um resumo útil de muitos tipos de dados.
Análise Univariada
A análise univariada envolve descrever a distribuição de uma única variável, incluindo sua medida cen-
tral (incluindo a média, mediana, e a Moda (estatística) e dispersão (incluindo a diferença entre o maior
e menor valor da amostragem e quantil do conjunto de dados, além da variância e desvio padrão).
A forma da distribuição pode também ser descrita com obliquidade e curtose. Características da distri-
buição da variável podem também ser representados em gráficos ou tabulas, incluindo Histograma.
Análise Bivariada
Quando uma amostra consiste de mais de uma variável, a estatística descritiva pode ser usada para
descrever o relacionamento entre os pares de variáveis. Nesse caso, estatística descritiva inclui:
Tabulações cruzadas e tabelas de contingência
Representação gráfica via gráfico de dispersão.
As medidas quantitativas de dependência.
As descrições de distribuição condicionais.
A razão principal para diferenciar analise univariada e bivariada é que a bivariada não é só análise
descritiva simples, mas também o relacionamento entre duas variáveis diferentes. de Pearson quando
ambas as variáveis são continuas, ou Coeficiente de correlação de postos de Spearman quando ambas
variáveis não são continua) e covariância.
WWW.DOMINACONCURSOS.COM.BR 1
ESTATÍSTICA DESCRITIVA
Técnicas
As técnicas usadas costumam classificar-se como:
Gráficos descritivos: São usados vários tipos de gráficos para sumarizar os dados. Por exemplo: His-
togramas.
Descrição Tabular: Na qual se usam tabelas para sumarizar os dados. Por exemplo tabelas de Fre-
quências.
Descrição Paramétrica: Na qual estimamos os valores de certos parâmetros, os quais assumimos que
completam a descrição do conjunto dos dados. Por exemplo: Média.
Objectivos Dos Parâmetros
Podemos querer escolher um parâmetro que nos mostre como as diferentes observações são seme-
lhantes. Os textos académicos costumam chamar a este objectivo de "medidas de tendência central".
Podemos querer escolher parâmetros que nos mostrem como aquelas observações diferem. Costuma
chamar-se a este tipo de parâmetros de "medidas de dispersão“.
Probabilidade E Estatística
A palavra probabilidade deriva do Latim probare(provar ou testar). Informalmente, provável é uma das
muitas palavras utilizadas para eventos incertos ou conhecidos, sendo também substituída por algumas
palavras como “sorte”, “risco”, “azar”, “incerteza”, “duvidoso”, dependendo do contexto.
A probabilidade é um número que varia de 0 (zero) a 1 (um) e que mede a chance de ocorrência de um
determinado resultado. Quanto mais próxima de zero for a probabilidade, menores são as chances de
ocorrer o resultado e quanto mais próxima de um for a probabilidade, maiores são as chances.
As probabilidades podem ser expressas de diversas maneiras, inclusive decimais, frações e percenta-
gens. Por exemplo, a chance de ocorrência de um determinado evento pode ser expressa como 10%;
5 em 10; 0,20 ou 1/7.
Experimento Aleatório
Experimento é qualquer atividade realizada que pode apresentar diferentes resultados. Um experi-
mento é dito aleatório quando não conseguimos afirmar o resultado que será obtido antes de realizar o
experimento. Um experimento é dito equiprovável se todos os possíveis resultados possuem a mesma
chance de ocorrer.
Espaço Amostral e Evento
Em uma tentativa com um número limitado de resultados, todos com chances iguais, devemos consi-
derar:
Espaço Amostral (E)
Espaço amostral é o conjunto E cujos elementos são todos os possíveis resultados que podem ser
obtidos na realização de um experimento.
Evento (A)
Evento é qualquer subconjunto de um espaço amostral.
Cálculo De Probabilidades
Seja um evento A de um espaço amostral referente a um experimento aleatório e equiprovável.
A probabilidade P(A) de se obter o evento A é dada por:
WWW.DOMINACONCURSOS.COM.BR 2
ESTATÍSTICA DESCRITIVA
Onde:
n(A) é o número de elementos do evento A;
n(E) é o número de elementos do espaço amostral
Estatística
A Estatística está presente em todas as áreas da ciência que envolvam o planejamento do experimento,
a construção de modelos, a coleta, o processamento e a análise de dados e sua consequente transfor-
mação em informação, para validar hipóteses científicas sobre um fenômeno observável. Desta forma,
a Estatística pode ser pensada como a ciência de aprendizagem a partir de dados.
A aplicação de técnicas estatísticas a dados meteorológicos tem a vantagem de compactar o enorme
volume de dados, medidos, por exemplo, em uma estação, em uma simples tabela ou uma equação,
capaz de sumariar todas as informações de modo a facilitar as inferências sobre os dados.
Definição
A estatística é uma coleção de métodos para planejar experimentos, obter dados e organiza-los, re-
sumi-los, analisá-los, interpretá-los e deles extrair conclusões.
Noções De Estatística
Amostra
São elementos coletados dentro do vasto universo.
ROL
É toda sequência de dados numéricos.
Exemplo:
Os cincos alunos de uma amostra apresentaram as seguintes notas na prova bimestral de matemática
6; 4; 8; 7; 8. Apresentando esses dados em rol, temos: (4; 6; 7; 8; 8) ou (8; 8; 7; 6; 4).
Classes
Qualquer intervalo real que contenha um rol da amostra.
Medidas De Posição
São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribui-
ção em relação ao eixo horizontal do gráfico da curva de frequência.
As medidas de posições mais importantes são as medidas de tendência central ou pro médias (verifica-
se uma tendência dos dados observados a se agruparem em torno dos valores centrais).
As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.
Média Aritmética
WWW.DOMINACONCURSOS.COM.BR 3
ESTATÍSTICA DESCRITIVA
É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
Média Aritmética Ponderada
Consideremos uma coleção formada por n números, de forma que cada um esteja sujeito a um peso
(valor que indica a quantidade de vezes em que cada número se repete).
A média aritmética ponderada desses n números é a soma dos produtos de cada um por seu peso,
dividida pelos somatórios dos seus pesos, isto é:
Nota: “peso” é sinónimo de “ponderação
MODA: (Mo)
É o valor que ocorre com maior frequência.
Quando dois valores ocorrem com a mesma frequência, cada um deles é chamado de uma moda, e o
conjunto se diz BIMODAL.
Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda e o
conjunto é MULTIMODAL.
Quando nenhum valor é repetido o conjunto não tem moda
Mediana (Md)
Valor do meio do conjunto de dados, quando os valores estão dispostos em ordem crescente ou de-
crescente; divide um conjunto de dados em duas partes iguais.
Para calcular:
Disponha os valores em ordem (crescente ou decrescente)
Se o número de valores é ímpar, a mediana é o número localizado no meio da lista.
Se o número é par, a mediana é a média aritmética dos dois valores do meio.
Medidas De Dispersão
Existem algumas medidas chamadas medidas de dispersão, que procuram mostrar como os elementos
do conjunto se comportam em torno da região central, ou seja, medidas que mostram se eles estão
mais ou menos dispersos.
Por exemplo, num jogo de duplas de tênis, são conhecidas as idades dos jogadores:
Equipe A Equipe B
O jogador 1 tem 26 anos; O jogador 1 tem 45 anos;
O jogador 2 tem 24 anos. O jogador 2 tem 5 anos.
WWW.DOMINACONCURSOS.COM.BR 4
ESTATÍSTICA DESCRITIVA
Veja que, nos dois casos, a média das idades é a mesma, ou seja, 25 anos.
No entanto, as idades da equipe B estão bem mais dispersas em torno da média do que as idades da
equipe A.
Duas medidas de dispersão são chamados de Variância e Desvio-Padrão.
Variância
Veja, por exemplo, o conjunto de dados:
2, 5, 6, 8, 14,
Onde a média aritmética é 7. A diferença entre cada valor é a média é chamada desvio. Assim, os des-
vios para o nosso conjunto de dados serão:
Observação: a soma dos desvios é sempre nula.
Chamamos variância de um conjunto de dados a média aritmética dos quadrados dos desvios. No
nosso exemplo, temos:
A variância é :
Desvio-Padrão
O desvio-padrão é definido como a raiz quadrada da variância, sendo indicado por
Assim, no nosso exemplo, temos:
WWW.DOMINACONCURSOS.COM.BR 5
ESTATÍSTICA DESCRITIVA
Variáveis aleatórias discretas
Definição 2.2.1:
Seja uma variável aleatória (v.a.). Se o número de valores possíveis de for enumerável (finito ou
infinito), dizemos que é uma variável aleatória discreta. Isto é, os possíveis valores de podem ser
postos em lista como . No caso finito, a lista possui um valor final , e no caso infinito, a lista
continua indefinidamente.
Exemplo 2.2.1:
Suponha que, após um exame médico, pessoas sejam diagnosticadas como tendo diabetes (D) e não
tendo diabetes (N). Admita que três pessoas sejam escolhidas ao acaso e classificadas de acordo com
esse esquema.
O espaço amostral é dado por
Nosso interesse é saber quantas pessoas com diabetes foram encontradas, não interessando a ordem
em que tenham sido selecionadas. Isto é, desejamos estudar a variável aleatória , a qual atribui a
cada resultado o número de pessoas com diabetes. Consequentemente, o conjunto dos possí-
veis valores de é , ou seja, é uma variável aleatória discreta.
Definição 2.2.2:
Seja uma variável aleatória discreta. A cada possível resultado associaremos um número
, denominado probabilidade de . Os números , devem satisfa-
zer as seguintes condições:
para todo ;
A função é denominada função de probabilidade da variável aleatória .
Definição 2.2.3:
A coleção de pares ; é algumas vezes denominada distribuição de probabilidade
de .
Assim, podemos falar que a distribuição de probabilidades de uma variável aleatória discreta , defi-
nida em um espaço amostral , é uma tabela que associa a cada valor de sua probabilidade.
Exemplo 2.2.2:
Considere que uma moeda é lançada duas vezes. Seja a função definida no espaço amostral que é
igual ao número de caras nos dois lançamentos ( - Cara e - Coroa).
Temos na Tabela a seguir a distribuição de probabilidade referente a variável aleatória X.
Valores de X Pontos amostrais Probabilidade
0 KK 1/4
1 KC, CK 1/2
2 CC 1/4
WWW.DOMINACONCURSOS.COM.BR 6
ESTATÍSTICA DESCRITIVA
Os valores das probabilidades, na tabela acima, são obtidos da seguinte maneira:
Definição 2.2.4:
O quantil ( ) de uma variável aleatória discreta é o menor valor de para o qual
Já o percentil de um valor é o valor da distribuição acumulada em , ou seja,
Relação entre a função de distribuição acumulada e a distribuição de probabilidade discreta
Seja uma variável aleatória discreta cuja distribuição de probabilidade associa aos valo-
res as respectivas probabilidades .
Como os valores de são mutuamente exclusivos, temos que a função de distribuição acumulada é
dada por
Assim, dada a distribuição de probabilidade de uma variável aleatória discreta, conseguimos determinar
sua função de distribuição acumulada, ou ainda, dada a função de distribuição acumulada, podemos
determinar a sua distribuição de probabilidade.
Exemplo 2.2.3:
Considere dois lançamentos independentes de uma moeda equilibrada. Com o espaço de probabili-
dade usual, defina como sendo o número de caras nos dois lançamentos. Determine a função de
distribuição acumulada de .
A variável é discreta e sua distribuição de probabilidade será dada por
A função de distribuição acumulada correspondente será:
WWW.DOMINACONCURSOS.COM.BR 7
ESTATÍSTICA DESCRITIVA
Variáveis aleatórias contínuas
Definição 2.3.1:
Seja uma variável aleatória. Suponha que o contradomínio ( ) de seja um intervalo ou uma
coleção de intervalos. Então diremos que é uma variável aleatória contínua.
Os exemplos abaixo ajudam a ilustrar esse conceito.
Exemplo 2.3.1:
Uma válvula eletrônica é instalada em um circuito, seja o período de tempo em a válvula funciona.
Neste caso, é uma variável aleatória contínua podendo tomar valores nos reais positivos, ou seja, o
subconjunto dos números reais .
Exemplo 2.3.2:
Um navio petroleiro sofre um acidente no qual seu casco é rompido e o óleo é derramado. Seja a
variável aleatória que determina a área atingida pelo óleo do navio.
Neste caso, temos que a variável é uma variável continua a qual também assume valores em no
subconjunto dos números reais .
Definição 2.3.2:
Dizemos que é uma variável aleatória absolutamente contínua se existe uma função
denominada função densidade de probabilidade e abreviada por f.d.p, que satisfaz
às seguintes propriedades:
, para todo
Além disso, definimos para qualquer , com que
Vale a pena notar que, da forma como a probabilidade foi definida, a probabilidade de um ponto isolado
é sempre zero, ou seja, . Desta forma, podemos concluir que, quando
é uma variável aleatória contínua, a probabilidade de ocorrer um valor especifico é zero.
WWW.DOMINACONCURSOS.COM.BR 8
ESTATÍSTICA DESCRITIVA
Observação:
Se é uma variável aleatória absolutamente contínua, então
Exemplo 2.3.3:
Suponha que escolhamos um número ao acaso no intervalo . Qual a probabilidade de escolhermos
o número ?
É zero justamente pelo que foi dito acima, todo ponto isolado em uma variável continua tem probabili-
dade zero.
Exemplo 2.3.4:
Seja e seja uma variável aleatória tal que sua função densidade de proba-
bilidade seja definida abaixo, com sendo uma constante. Qual deve ser o valor da constante ?
Como é uma função densidade de probabilidade ela deve satisfazer a condição que
Exemplo 2.3.5:
Consideremos uma variável aleatória com densidade abaixo:
Determine o valor de c.
Para isto basta integrarmos a função f(x) em todo o seu domínio, lembrando que esta integral deve ter
valor 1. Assim
Exemplo 2.3.6:
Seja uma variável contínua com f.d.p.
WWW.DOMINACONCURSOS.COM.BR 9
ESTATÍSTICA DESCRITIVA
Portanto, a função de distribuição acumulada é dada por
Exemplo 2.3.7:
Suponha que o Lucro Líquido ( ) de uma empresa para o ano futuro esteja entre e
. Além disso, temos informações suficientes para supor que o esteja concentrado em
torno do valor médio do intervalo, isto é, em torno de Com isso, podemos modelar
a distribuição de via uma forma triangular, como na Figura a seguir.
Observe que a função de distribuição de probabilidade é construída de forma que a área total abaixo
da curva é igual a 1, note também que ela está concentrada em torno do ponto médio do intervalo
(16.000) e se distribui linearmente do ponto médio aos extremos do intervalo. De forma geral, a função
distribuição de probabilidade de uma distribuição triangular é dada por:
Exemplo 2.3.8:
Seja uma variável aleatória absolutamente contínua com função distribuição de probabili-
dade (f.d.p.) dada por
Neste caso, dizemos que tem distribuição Normal.
Resolução:
WWW.DOMINACONCURSOS.COM.BR 10
ESTATÍSTICA DESCRITIVA
Para que seja uma f.d.p, basta mostrarmos que
Então, tomamos
e, a partir da mudança de variáveis e , temos que:
Teoremas Limites
Os teoremas limites clássicos de probabilidade se referem à sequencias de variáveis aleatórias inde-
pendentes e identicamente distribuídas (i.i.d.). Se X1,X2,...X1,X2,... é uma sequência de variáveis ale-
atórias com uma média comum, E[X]=μ<∞E[X]=μ<∞, e seja a v.a. Sn=X1+...+XnSn=X1+...+Xn.
A Lei dos Grandes Números informa que a sequência das médias Sn/nSn/n converge para μμ, quando
n→∞n→∞.
Existem duas versões da Lei, a fraca e a forte
Lei Fraca dos Grandes Números
A Lei Fraca dos Grandes Números é um resultado em Teoria da Probabilidade também conhecido
como Teorema de Bernoulli’s. De acordo com a lei, a média dos resultados obtidos por um grande
número de tentativas é próximo a média da população.
Seja Xi...XnXi...Xn uma sequência de variáveis aleatórias identicamente distribuídas e independen-
tes iidiid, cada uma possuindo média μμ e variância σ2σ2. E a variável aleatória X¯¯¯¯X¯, definida
como,
X¯¯¯¯=X1+ … +Xnn=SnnX¯=X1+ … +Xnn=Snn
Então o valor esperado da variável aleatória X¯¯¯¯X¯ é,
E[X¯¯¯¯]=E(X1+…+Xnn)E[X¯¯¯¯]=1n(E(X1)+… +E(Xn))E[X¯¯¯¯]=nμn=μE[X¯]=E(X1+…+Xnn)E[X¯]=
1n(E(X1)+… +E(Xn))E[X¯]=nμn=μ
E a variância é,
V(X¯¯¯¯)=V(X1+…+Xnn)V(X¯¯¯¯)=V(1n)(V(X1)+…+V(Xn))V(X¯¯¯¯)=1n2(σ2+…+σ2)V(X¯¯¯¯)
Valor Esperado e Variância
Seja X¯¯¯¯X¯ uma variável aleatória definida como,
X¯¯¯¯=Snn=X1+…+XnnX¯=Snn=X1+…+Xnn
o valor esperado e a variância são,
E[X¯¯¯¯]=μV(X¯¯¯¯)=σ2nE[X¯]=μV(X¯)=σ2n
Pela desigualdade de Chebyshev temos que,
WWW.DOMINACONCURSOS.COM.BR 11
ESTATÍSTICA DESCRITIVA
limn→∞P(|X1+…+Xnn−μ|≥ϵ)≤σ2nϵ2limn→∞P(|X1+…+Xnn−μ|≥ϵ)≤σ2nϵ2
De forma simplificada significa dizer que quando n→∞n→∞ a v.a. X¯¯¯¯X¯ que é a média amostral
será igual a média populacional μμ. Ou seja a probabilidade de que a diferença entre a média amostral
e a média populacional ser maior que um valor constante qualquer (ϵ>0ϵ>0), tende a zero.
Teorema - Lei Fraca dos Grandes Números
Para qualquer ϵ>0ϵ>0,
limn→∞P(|Snn−μ|<ϵ)=1limn→∞P(|Snn−μ|<ϵ)=1
Enquanto a lei fraca assegura que para um valor grande de nn, a média Sn/nSn/n ou X¯¯¯¯X¯ é pró-
xima de μμ com alta probabilidade, a lei não informa que, uma vez estando próxima de μμ, a sequência
de médias permanecerá próxima de μμ.
Lei Forte dos Grandes Números
A lei forte dos grandes números assegura que com probabilidade 1 a sequência de médias S11, S22,
S33,... S11, S22, S33,... tende a média μμ e se comporte dessa forma.
Teorema - Lei Forte dos Grandes Números
P(limn→∞Snn=μ|)=1P(limn→∞Snn=μ|)=1
Lei Grandes Números
Em resumo a lei do grandes números demonstra que,
Lei dos Grandes Números
Snn−μ→0,n→∞Snn−μ→0,n→∞
A seguir é apresentado dois exemplos dessa convergência, a partir da simulação de valores de uma
população Binomial e uma Normal.
=σ2n
WWW.DOMINACONCURSOS.COM.BR 12
ESTATÍSTICA DESCRITIVA
Teorema Central do Limite
O Teorema Central do Limite (TCL) é um dos teoremas mais importante dentro da Estatística e Proba-
bilidade. É um teorema limite que foi considerado como “Central” pelo matemático húngaro George
Pólya.
Brevemente, o Teorema Central do Limite estabelece que a distribuição da soma (ou média) de um
grande número de variáveis aleatórias independentes e identicamente distribuídas (i.i.d.) será aproxi-
madamente normal, independentemente da distribuição subjacente (dessas variáveis).
Esse é um dos motivos porque a distribuição normal é utilizada em tantos testes estatísticos.
Vamos abordar o teorema apresentando de forma bastante resumida alguns pontos importantes e suas
consequências.
Processo de Soma Parcial
Suponha que X1,X2,...X1,X2,... é uma sequência de variáveis aleatórias independentes e identica-
mente distribuídas, com uma distribuição de densidade fX(x)fX(x), média μμ e variância σ2σ2 em co-
mum. Assumimos que 0<σ2<∞0<σ2<∞, para que as variáveis aleatórias sejam realmente aleatórias e
não constantes.
Seja,
Sn=X1+...Xn,n∈NSn=X1+...Xn,n∈N
Por convenção temos que S0=0S0=0, uma vez que a soma é sobre um conjunto vazio.
O processo aleatório (estocástico) S0,S1,S2,...S0,S1,S2,... é chamado de processo de soma parcial
associado com XX.
Em termos estatísticos (para diferenciar da teoria de probabilidade), a sequência X1,X2,...X1,X2,... cor-
responde ao processo de amostragem de uma dada população (ou distribuição). De forma particu-
lar, (X1,X2,...,Xn)(X1,X2,...,Xn) é uma amostra aleatória de tamanho nn dessa distribuição, e a corres-
pondente média amostral é
X¯¯¯¯=Snn=X1+ … +Xnn=1n∑i=1nXiX¯=Snn=X1+ … +Xnn=1n∑i=1nXi
E pela Lei dos Grandes Números, Sn→μSn→μ quando n→∞n→∞ com probabilidade 1.
Note que, se n∈Nn∈N, então pela propriedade da linearidade do valor esperado, para v.a. independen-
tes:
WWW.DOMINACONCURSOS.COM.BR 13
ESTATÍSTICA DESCRITIVA
E[Sn]=nμV(Sn)=nσ2E[Sn]=nμV(Sn)=nσ2
Como pode-se notar acima não podemos esperar que SnSn tenha uma distribuição limitante
quando n→∞n→∞, pois a V(Sn)→∞V(Sn)→∞ bem como o E[X]→∞E[X]→∞.
Porém antes mesmo de estabelecer esses limites podemos verificar a forma da distribuição a medida
que nn aumenta, e visualizar a pressuposição e deduções dos teoremas e leis apresentadas até aqui.
Através de uma simulação Monte Carlo verificaremos a forma de uma distribuição da variável aleató-
ria SnSn, que é a soma de v.a.s independentes e identicamente distribuídas.
Começaremos a simulação da soma de duas v.a. uniformes X∼U(0,1)X∼U(0,1)
Sn=X1+...+XnS2=X1+X2
WWW.DOMINACONCURSOS.COM.BR 14
ESTATÍSTICA DESCRITIVA
Nota-se que a forma da distribuição SnSn converge em uma distribuição normal com
E[Sn]=nμE[Sn]=nμ e V(Sn)=nσ2V(Sn)=nσ2.
Porém note que a distribuição irá se degenerar quando n→∞n→∞, pois quando
E[Sn]→∞E[Sn]→∞ e V(Sn)→∞V(Sn)→∞.
De forma similar para
Sn/n=X¯¯¯¯Sn/n=X¯, E[X¯¯¯¯]→μE[X¯]→μ e V(X¯¯¯¯)→σ2/n→0V(X¯)→σ2/n→0.
Assim sabemos que Sn/n→μSn/n→μ quando n→∞n→∞ com probabilidade 1, e a distribuição limite da
soma de variáveis aleatórias SnSn ou da média amostral Sn/n=X¯¯¯¯Sn/n=X¯ irá se degenerar.
Então para se obter uma distribuição limitante de SnSn ou Sn/n=X¯¯¯¯Sn/n=X¯ que não se degenere,
precisaremos considerar, não as variáveis aleatórias por si, mas as variáveis normalizadas,
Zn=Sn−nμn−−√σ=X¯¯¯¯−μσ/n−−√
Teorema Central do Limite
WWW.DOMINACONCURSOS.COM.BR 15
ESTATÍSTICA DESCRITIVA
Seja ZnZn uma variável aleatória definida como,
Zn=X¯¯¯¯−μσ/n−−√∼N(0,1)Zn=X¯−μσ/n∼N(0,1)
o valor esperado e a variância são,
E[X¯¯¯¯]=0V(X¯¯¯¯)=1E[X¯]=0V(X¯)=1
O Teorema Central do Limite estabelece que a distribuição de ZnZn converge em distribuição para uma
distribuição normal padrão quando n→∞n→∞
Note que o teorema não restringe a sua dedução à algum tipo específico de distribuição de XX. Dessa
forma o teorema é válido para qualquer tipo de distribuição.
Abaixo segue o código que demonstra os resultados do teorema do limite central para a distribuição da
média amostral e variância amostral de amostras obtidas de diferentes v.a.s, para as distribuições,
Exponencial, Normal, Uniforme, Poisson, etc… O código foi disponibilizado por Nicole Radziwill
Code
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
WWW.DOMINACONCURSOS.COM.BR 16