Carlos João Rendrá
Cremildo Felizardo Manuel
Délio Telmo Atanásio
Muhammade Cheiba
Quisito Remígio Moçambique
Estatística descritiva
Instituo superior de Ciencias e Tecnologias Alberto Chipande
Pemba, Setembro 2024
Carlos João Rendrá
Cremildo Felizardo Manuel
Délio Telmo Atanásio
Muhammade Cheiba
Quisito Remígio Moçambique
Estatística descritiva
Licenciatura em Engenharia Agro-pecuaria
Docente: Faruque Raisse Esmael
Instituo superior de Ciencias e Tecnologias Alberto Chipande
Pemba, Setembro 2024
Introdução
O presente trabalho visa a abordar num tema relacionado sobre a estatística descritiva,
que esta conceitualizado como sendo um ramo da estatística que se dedica a organizar,
resumir e descrever um conjunto de dado. Ao contrario da estatística inferencial, que faz
previsões ou inferências sobre uma população com base em uma amostra. A estatística
descritiva se concentra apenas em analisar e apresentar os dados de forma clara e
compreensível.
A estatística descritiva tem como componentes principais:
Distribuição de frequência, que tem como objectivo de organizar os dados em grupo e
mostra quantas vezes cada valor aparece.
Medidas de tendência central, inclui a média (valor médio), a mediana (valor central) e
a moda (valor mais frequente).
Medidas de variabilidade, tem como função de avaliar a dispersão de dados, como o
desvio padrão e a variância.
Objectivo geral:
Abordagem sobre a estatística descritiva
Objectivos específicos:
Dar o conceitos basicos da população, Parámetro populacional, Amostra,
Estatistica;
Classificar as variaveis aleatorias (qualitativas , ordinal e quantitativa);
Saber como construir tabelas, graficos e distribuição de frequências;
Conhecer as medidas de tendencia central (media, mediana, moda ) e dispersão
da variância, desvio padrão, coeficiente de variação para dados agrupados e não
agrupados .
Metodologia
Para fazer face a realização do trabalho recorremos a diversas fontes com a finalidade
de reunir uma informação satisfatória e de fácil compressão através de consulta de
obras, revisões bibliográficas e pesquisas que efectuamos na biblioteca electrónica, que
versam sobre o tema em destaque nas quais vem mencionadas no fim do trabalho.
REVISAO DE LITERATURA
População
Refere-se ao conjunto completo de indivíduos, eventos ou itens de interesse em um
estudo ou pesquisa. Em estatística, a população é o grupo sobre o qual se deseja tirar
conclusões. Por exemplo, se uma pesquisa visa estudar as preferências alimentares de
todos os adultos de um país, a população seria todos os adultos desse país.
Parâmetro Populacional:
Um parâmetro populacional é um valor numérico que descreve uma característica da
população. Ele é uma medida fixa, embora normalmente desconhecida, porque a
medição exata de toda a população geralmente não é prática. Exemplos de parâmetros
incluem a média populacional (μ), a proporção populacional (p) e a variância
populacional (σ²).
Amostra
Uma amostra é um subconjunto da população que é coletado e analisado para fazer
inferências sobre a população como um todo. Em geral, uma amostra deve ser
representativa da população para que as inferências sejam válidas. O tamanho e a forma
como a amostra é selecionada podem afetar os resultados.
Estatística
Estatística refere-se à ciência que lida com a coleta, organização, análise e interpretação
de dados. Existem dois tipos principais de estatística:
- Estatística Descritiva: Envolve a organização e o resumo dos dados através de
gráficos, tabelas ou medidas como média e desvio padrão.
- Estatística Inferencial: Usa dados de uma amostra para fazer inferências ou previsões
sobre uma população, utilizando métodos como intervalos de confiança e testes de
hipóteses.
Medidas de tendência central
As medidas de tendência central são ferramentas estatísticas essenciais para descrever e
interpretar conjuntos de dados. Elas nos fornecem informações sobre a posição central
ou “típica” de um conjunto de valores, permitindo uma compreensão mais clara e
resumida dos dados.
Medidas de tendência central são valores únicos que tentam capturar a característica
central de uma distribuição de dados. As três medidas de tendência central mais comuns
são a média, a mediana e a moda. Cada uma dessas medidas oferece uma perspectiva
diferente sobre os dados, e a escolha entre elas depende do tipo de dados e da análise
desejada.
A Média
A média aritmética, frequentemente referida simplesmente como média, é a soma de
todos os valores dividida pelo número de valores. É a medida de tendência central mais
conhecida e amplamente utilizada devido à sua simplicidade e capacidade de resumir
dados quantitativos.
A média aritmética é útil quando se deseja uma visão geral do conjunto de dados,
especialmente quando os dados são simétricos. No entanto, a média pode ser
influenciada por valores atípicos (outliers), tornando-a menos representativa em
distribuições assimétricas.
A Mediana
A mediana é o valor que separa a metade inferior da metade superior de um conjunto de
dados ordenado. Para encontrar a mediana, é necessário organizar os dados em ordem
crescente e identificar o valor central.
Cálculo da Mediana
Para um conjunto de dados com um número ímpar de observações, a mediana é o valor
do meio. Já para um conjunto de dados com um número par de observações, a mediana
é a média dos dois valores centrais.
A mediana é particularmente útil em distribuições assimétricas, pois não é afetada por
valores atípicos como a média. Por exemplo, ao analisar rendimentos, a mediana pode
oferecer uma visão mais precisa da distribuição central, evitando a distorção causada
por salários extremamente altos ou baixos.
A Moda
A moda é o valor que aparece com mais frequência em um conjunto de dados. Diferente
da média e da mediana, a moda pode ser utilizada tanto para dados quantitativos quanto
qualitativos. Em distribuições unimodais, existe apenas uma moda. Em distribuições
bimodais ou multimodais, há duas ou mais modas.
Exemplo Prático da Moda
Suponha que temos os seguintes dados sobre as cores preferidas de um grupo de
pessoas: vermelho, azul, verde, azul, amarelo, azul, vermelho. A moda desse conjunto
de dados é “azul”, pois é a cor que aparece com mais frequência. Em aplicações
práticas, como o marketing, a moda pode indicar a preferência de consumo ou
tendências de mercado.
Classificação das Variáveis Aleatórias
Definição de Variável Aleatória:
Uma variável aleatória é um valor numérico ou categórico que resulta de experimentos
ou observações.É usada para descrever eventos incertos ou aleatórios.
Tipos de Variáveis Aleatórias:
Elas podem ser classificadas em três tipos principais: quantitativas, qualitativas e
ordinais.
Variáveis Quantitativas:
Representam valores numéricos e podem ser mensuradas.Podem ser subdivididas em:
Contínuas: Valores em uma escala contínua (ex.: altura, peso, tempo).
Discretas: Assumem valores específicos (ex.: número de filhos, número de carros).
Variáveis Qualitativas:
Também conhecidas como categóricas, essas variáveis descrevem características ou
atributos.
Não têm valores numéricos e são divididas em grupos ou categorias.
Exemplo: gênero (masculino, feminino), cor dos olhos (azul, verde, castanho).
Variáveis Ordinais:
São uma combinação de variáveis qualitativas e quantitativas.Possuem uma ordem ou
hierarquia natural, mas a diferença entre as categorias não pode ser mensurada com
precisão.
Exemplo: classificação de uma pesquisa de satisfação (ruim, bom, excelente), níveis de
escolaridade (fundamental, médio, superior).
Distribuição de Frequência
A distribuição de frequência é uma ferramenta estatística fundamental que organiza e
resume um conjunto de dados, permitindo uma análise mais clara e eficiente das
informações. Essa técnica consiste em agrupar os dados em intervalos ou classes,
facilitando a visualização da frequência com que cada intervalo ocorre dentro do
conjunto. A distribuição de frequência é amplamente utilizada em diversas áreas, como
pesquisa de mercado, ciências sociais, saúde e, principalmente, na análise de dados,
onde a interpretação correta dos dados é crucial para a tomada de decisões.
Para compreender a distribuição de frequência, o primeiro passo é entender a
importância de medir frequência em análise de dados. Além de auxiliar a entender
tendências, os gráficos e tabelas de frequência podem ser organizados para mostrar
dados diversos.
Desse modo, a frequência significa o número de vezes em que o elemento aparece em
uma amostra. Sendo assim, na amostra “G, T, S, J, T, L, Y, P, S, T”, a frequência de T é
3, a de S é 2 e a de G, J, L, Y e P é 1.
Tipos de Distribuição de Frequência
Existem diferentes tipos de distribuição de frequência que podem ser utilizados,
dependendo da natureza dos dados e do objetivo da análise. A distribuição de frequência
simples é a mais básica, onde os dados são organizados em uma tabela que mostra a
contagem de ocorrências para cada valor ou intervalo. Já a distribuição de frequência
acumulada apresenta a soma das frequências até um determinado ponto, permitindo uma
visão mais abrangente do comportamento dos dados. Além disso, a distribuição de
frequência relativa expressa a frequência de cada intervalo em relação ao total de
observações, facilitando comparações entre diferentes conjuntos de dados.
Construção de uma Tabela de Distribuição de Frequência
Tabelas de frequência são uma forma de organizar dados em uma tabela para mostrar a
frequência de ocorrência de cada valor ou intervalo de valores em um conjunto de
dados. Utiliza-se em estatística para resumir grandes conjuntos de dados e torná-los
mais fáceis de entender e analisar. Uma tabela de frequência geralmente inclui duas
colunas: Uma coluna para os valores do conjunto de dados e outra coluna para as
frequências. A coluna de valores lista cada valor único no conjunto de dados, enquanto
a coluna de frequências mostra quantas vezes cada valor aparece no conjunto de dados.
Então, as tabelas de frequência podem ser usada para analisar dados quantitativos ou
qualitativos. Para dados quantitativos, os valores podem ser agrupados em intervalos e a
tabela de frequência mostra a frequência de cada intervalo. Para dados qualitativos, a
tabela de frequência pode mostrar a frequência de cada categoria.
Para construir uma tabela de distribuição de frequência, é necessário seguir algumas
etapas. Primeiro, deve-se coletar os dados e determinar o número de classes que serão
utilizadas. Em seguida, define-se a amplitude de cada classe, que é a diferença entre o
maior e o menor valor do conjunto de dados, dividida pelo número de classes. Após
isso, os dados são organizados em intervalos e a frequência de cada intervalo é contada.
Por fim, a tabela é montada, apresentando os intervalos, as frequências absolutas, as
frequências relativas e, se necessário, as frequências acumuladas.
Exemplo de Tabela de Frequência
Frequência Frequência
Valor Absoluta Frequência Relativa (%) Acumulada
1 3 15 3
2 5 25 8
3 7 35 15
4 5 25 20
Gráficos de Distribuição de Frequência
Os gráficos de distribuição de frequência são ferramentas visuais que ajudam a
representar os dados de maneira mais intuitiva. O histograma é um dos gráficos mais
comuns, onde as classes são representadas por barras verticais, e a altura de cada barra
indica a frequência de cada intervalo. Outro gráfico utilizado é o polígono de
frequência, que conecta os pontos médios de cada intervalo, proporcionando uma visão
mais clara da distribuição dos dados.
Esses gráficos são essenciais para identificar padrões, tendências e anomalias nos
dados, facilitando a interpretação e a comunicação dos resultados.
Escolha o Tipo de Gráfico: Gráficos de barras ou histogramas são comuns para dados
discretos, enquanto gráficos de linhas são usados para dados contínuos.
Eixos do Gráfico:
Eixo X (Horizontal): Valores dos dados.
Eixo Y (Vertical): Frequências (absoluta ou relativa).
Plotagem: Marque os pontos ou barras correspondentes às frequências dos valores.
Título e Legendas: Adicione um título ao gráfico e legendas para facilitar a
interpretação.
Tipos de gráficos para distribuição de frequência
Além das tabelas, é possível usar elementos gráficos para explorar os resultados da
distribuição de frequência. No caso da amostra “concentrar”, por exemplo, um gráfico
seria:
Importância da distribuição de frequência?
O estudo de estatística tem grandes vantagens para diferentes setores. No setor
educacional, por exemplo, é possível analisar tendências de acordo com o rendimento
de alunos, tipo de aluno matriculado, qual a principal motivação para a busca de cada
curso, entre outras informações.
Na indústria
O mesmo também ocorre nas indústrias. Com campanhas de marketing e estratégias de
inovação em mãos, os especialistas empresariais muitas vezes precisam tomar decisões
de forma rápida e efetiva.
Conclusão
Concui-se que essas ferramentas ajudam a identificar padroes, tendencias e a entender
melhor os dados obtidos atraves de uma actividade. e os dados são uma peça chave para
chegar a essas conclusões. Ter uma boa organização de dados facilita o trabalho de
profissionais, permitem uma visualização mais rápida das informações e facilitam a
extração de conhecimento.
Este trabalho foi muito importante para o nosso conhecimento a compreensão o
aprofundamento deste tem porque permitiu nos ficar a conhecer e compreender melhor,
permitiu nos também desenvolver aperfeiçoar competências de investigação, selecção,
organização e comunicação da informação.
Referências bibliográficas
1. Weisberg H.F (1992) Central Tendency and Variability, Sage University Paper Series
on Quantitative Applications in the Social Sciences, ISBN 0-8039-4007-6 p.2
2. ↑ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP for International
Statistical Institute. ISBN 0-19-920613-9 (entry for "central tendency")
3. ↑ Ir para:a b Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics, OUP ISBN 978-0-
19-954145-4 (entry for "central tendency")
4. ↑ «Moda e Mediana». Só Matemática. Consultado em 28 de novembro de 2019
5. ↑ Johnson NL, Rogers CA (1951) "The moment problem for unimodal
distributions". Annals of Mathematical Statistics, 22 (3) 433–439
6. ↑ Hotelling H, Solomons LM (1932) The limits of a measure of skewness. Annals Math
Stat 3, 141–114
7. ↑ Garver (1932) Concerning the limits of a mesuare of skewness. Ann Math Stats 3(4)
141–142