UNIVERSIDADE DE BELAS
FACULDADE DE CIÊNCIAS DA SAUDE
MANUAL DE APOIO AO ESTUDANTE: DA DISCIPLINA DE BIOESTAÍSTICA
Elaborado por: Euclides Maquila
Abril de 2025
Material de Bioestatística
Estatística
Quem pretende efectuar estudos e tomar decisões começa muitas vezes por
recolher factos que são relevantes. Muitas vezes isso envolve a recolha de dados
numéricos. A Estatística é um ramo da Matemática Aplicada que fornece um
conjunto de instrumentos adequados para recolher, explorar, descrever e
interpretar conjuntos de dados numéricos. Para muitas pessoas, a Estatística
não passa de um conjunto de tabelas de dados numéricos.
Portanto a Estatística pode ser compreendida como um conjunto de técnicas
que permitem de forma sistemática organizar, descrever, analizar e interpretar
dados oriundos de estudos ou experimentos, realizados em qualquer área do
conhecimento.
Existem dois grandes ramos da estatística:
1) Estatística Descritiva;
2) Estatística Inferencial.
A Estatística Descritiva é formada por um conjunto de métodos utilizados para
recolher, analisar, resumir, e interpretar um conjunto de dados de forma a
descrever correctamente as suas características. A disponibilidade de uma
grande quantidade de dados e a existencia e de métodos computacionais muito
eficientes, revigorou esta área da Estatística.
A Estatística Inferencial é formada por um conjunto de métodos que permitem
tirar conclusões para um grupo determinado população ou universo a partir da
informação recolhida atráves da observação de uma amostra.
Antes de se introduzirem os instrumentos estatísticos e fundamental que se
dominem alguns conceitos importantes, os quais vão ser apresentados de
seguida.
População ou universo: Conjunto de todos os elementos que pretendemos
conhecer relativamente a determinadas características. O número de elementos
que constituem uma população é normalmente denominado por dimensão da
população (N).
Recenseamento: Operação que consiste em estudar todos os elementos que
constituem a população.
Sondagem: Operação que consiste em estudar um subconjunto dos elementos
que constituem a população.
Amostragem: Operação que consiste em formar uma amostra apartir de
elementos que constituem a população. A selecção da dos elementos que irão
compor a amostra pode ser feita de varias maneiras e irá depender do
conhecimento que se tem da população e da quantidade de recursos
disponíveis.
Amostra: Subconjuto de elementos de uma população. A dimensão da amostra
(n) é número de elementos que constituem a amostra.
Variável de interesse: São as características associadas a população
(informação) que se pretende estudar e pode variar ou seja, assumir um valor
diferente de elemento para elemento.
Dado estatístico: Resultado da observação efectuada sobre as unidades
estatísticas.
Tipos de variáveis
Variável qualitativa: Representa a medida ou possíveis valores de um atributo
em estudo não mensurável. Esta variável pode ser nominal e ordinal.
Variável qualitativa nominal: Os valores representam atributos ou qualidades
quem não tem uma relação de ordem entre eles. Exemplo: sexo dos pacientes,
grupo sanguíneo dos pacientes, raça dos pacientes.
Variável qualitativa ordinal: Os valores representam atributos ou qualidades
que incluem relações de orden entre eles. Exemplo: classe socia dos médicosl,
grau de instrução dos pacientes, estado civil dos pacientes, nível de escolaridade
dos pacientes.
Variável quantitativa: Representa a medida ou possíveis valores de um atributo
em estudo mensurável. Esta variável pode ser discreta e contínua.
Variável quantitativa discreta: O atributo em estudo é mensurável e assume
valores isolados. Exemplo: Número de acidentes, Número de filos.
Variável contínua: O atributo em estudo é mensurável e assume valores em
intervalos. Exemplo: massa corporal, horas, temperatura.
Bioestatística
Os pesquisadores de disciplinas relacionadas às ciências biológicas, agrárias e
à saúde utilizam uma grande variedade de ferramentas para entender os
fenómenos estudados por eles. Uma das mais importantes é a
bioestatística/estatística, pois esta desempenha um papel fundamental na
análise de dados coletados no contesto de testes químicos e ensaios biológicos,
bem como em estudos de outras áreas como epidemiologia, política sanitária,
saúde pública e familiar entre outras.
Definição de Bioestatística é a aplicação da Estatística ao campo Saúde e
biológico, sendo essencial ao planejamento, coleta, avaliação e interpretação de
todos os dados obtidos nas pesquisas em tais campos.
A estatística é uma ferramenta segura, uma ciência exacta. Incorparada ao
campo biológico e médico avalia com segurança dados médicos e biológicos,
tendo assim, uma maior segurança nas análises clínicas, com uso de
ferramentas avançadas e softwares estatísticos, realizando análises estatísticas
sobre o facto ou problema estudado.
Bioestatística é uma disciplina científica que é responsável pela aplicação de
análises estatísticas para diferentes questões relacionadas à biologia. Pode-se
dizer que a bioestatística é uma área ou uma especialização da estatística, a
ciência dedicada ao estudo quantitativo de todos os tipos de variáveis.
Distribuição de frequências para dados simples e representação gráfica
Uma das das formas de organizar e resumir a informação contida em conjuntos
de dados observados, a fim de se ter uma ideia de conjunto das características
mais relevantes, é por meio de tabelas de frequências e gráficos. O tipo de tabela
e de gráfico que se utiliza depende do tipo de variável em análise.
Uma distribuição de frequência é uma série estatística na qual os dados estão
organizados em grupos de classes ou categorias estabelecidas
convenientemente.
Frequência absoluta (𝒏𝒊 ): Definimos como frequência absoluta (𝑛𝑖 ) o número
de vezes que o dado aparece na amostra.
Frequência relativa (𝒇𝒊 ): A frequência relativa é dada pela razão (divisão) entre
a frequência absoluta e o número total de elementos da amostra.
Frequência absoluta acumulada (𝑵𝒂𝒊 ): A frequência absoluta acumulada é a
soma sucessiva dos valores da frequência absoluta.
Frequência relativa acumulada (𝑭𝒂𝒊 ): A frequência relativa acumulada é a
soma sucessiva dos valores da frequência relativa.
Frequência relativa percentual (𝒇𝒊 %): A frequência relativa percentual é obtida
pela multiplicação da frequência relativa por cem (100):
Distribuição de frequências para a variável qualitativa
Se pode construir uma tabela de distribuição de frequências que quantificam as
frequências de cada categoría de classificação e a sua representação gráfica
pode ser feita num gráfico de barras, num gráfico sectorial (gráfico circular).
Variável quantitativa discreta
Os dados organizam-se mediante tabela de frequências para dados simples e a
representação gráfica é mediante um gráfico de barra.
Elementos essencias de uma tabela
Os dados devem ser apresentados sob forma adequada em tabelas e gráficos,
para melhor entendimento do fenómeno em estudo. Portanto a Tabela é um
quadro que resume um conjunto de observações.
Ela é composta de:
Elementos de uma tabela
Título: O título deve responder as seguintes questões:
- O que? (Assunto a ser representado (Fato));
- Onde? (O lugar onde ocorreu o fenômeno (local));
- Quando? (A época em que se verificou o fenômeno (tempo)).
Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada
coluna.
Corpo: parte da tabela composta por linhas e colunas.
Linhas: parte do corpo que contém uma seqüência horizontal de informações.
Colunas: parte do corpo que contém uma seqüência vertical de informações.
Coluna Indicadora: coluna que contém as discriminações correspondentes aos
valores distribuídos pelas colunas numéricas.
Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma
coluna.
Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são
colocadas as notas de natureza informativa (fonte, notas e chamadas).
Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.
Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação
geral; chamada - esclarecer minúcias em relação a uma célula).
O Método Estatístico
Refere-se a todo o processo de utilizar o método científico para responder
questões e tomar decisões.
Envolve projetar estudos, coletar dados “bons”, descrever os dados com
números e gráficos, analisar os dados, elaborar conclusões, eventualmente
tomar decisões. Deixar os dados falarem por si próprios” – “Ouvir o que os dados
relatam. Mas os dados só falam claramente quando são organizados, resumidos,
apresentados, e os auxiliamos falar propondo questões apropriadas
Fases do método estatístico
O método estatístico abrange as seguintes fases:
a) Definição do Problema
Consiste na:
- formulação correta do problema;
- examinar outros levantamentos realizados no mesmo campo (revisão da
literatura);
- saber exatamente o que se pretende pesquisar definindo o problema
correctamente (variáveis, população, hipóteses, etc.
b) Planejamento
Determinar o procedimento necessário para resolver o problema:
- Como levantar informações;
- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
- Cronograma, Custos, etc.
c) Coleta ou levantamento dos dados
Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.
A coleta pode ser: Directa - diretamente da fonte; Indireta - feita através de outras
fontes.
Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no
registro de terceiros (secundários).
d) Apuração dos Dados ou sumarização
Consiste em resumir os dados, através de uma contagem e agrupamento. É um
trabalho de coordenação e de tabulação.
Apuração: manual, mecânica, eletrônica e eletromecânica.
e) Apresentação dos dados
É a fase em que vamos mostrar os resultados obtidos na coleta e na
organização.
Esta apresentação pode ser: Tabular (apresentação numérica)
Gráfica (apresentação geométrica)
f) Análise e interpretação dos dados
É a fase mais importante e também a mais delicada. Tira conclusões que
auxiliam o pesquisador a resolver seu problema.
Medidas de de localização de tendência central
As medidas de tendência central são normalmente as primeiras que se calculam para se
sintetizarem ou resumirem os conjuntos de dados. As medidas de tendência central
mostram o valor representativo em torno do qual os dados tendem a agrupar-se com
maior ou menor frequência. São utilizadas para sintetizar em um único número o
conjunto de dados observados.
Média Aritmética
Podemos dizer que esta é a mais importante medida de localização e que é mais
comumente usada para descrever um conjunto de observações. A média aritmética
simples de um conjunto de n observações é o quociente entre a soma dos dados e a
quantidade dessas observações. É denotada por 𝑋̅.
Fórmula da média aritmética dados brutos
∑𝒏𝒊=𝟏 𝑿
̅=
𝑿
𝒏
Fórmula da média aritmética dados na tabela de frequências
∑𝒏𝒊=𝟏 𝑿 ∙ 𝒇𝒂
̅=
𝑿
𝒏
Mediana
A mediana de um conjunto de n observações é o número cuja posição q divide ao conjunto de
dados em duas partes iguais , quando os dados estão ordenados. Se n é ímpar esse valor é único;
𝑛+1
Quando n é ímpar 𝑃𝑀 = 2
se n é par, a mediana é a média aritmética simples dos dois valores centrais.
Fórmula da mediana tabela de frequências dados agrupados
𝑃𝑀 − 𝑓𝑎𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝑀𝑒 = 𝐸𝐼 + ×ℎ
𝑓𝑎 𝑜𝑛𝑑𝑒 𝑠𝑒 𝑙𝑜𝑐𝑎𝑙𝑖𝑧𝑎 𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
Moda (Mo)
É o valor de maior frequência absoluta em um conjunto de dados. Ela é denotada por Mo.
Cálculo da moda apartir da tabela de frequências dados agrupados
A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos
afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da
classe modal.
𝐷1
𝑀𝑜 = 𝐸𝑖 + ×ℎ
𝐷1 + 𝐷2
Onde:
𝐷1 = 𝑀𝑎𝑖𝑜𝑟 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 − 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝐷2 = 𝑀𝑎𝑖𝑜𝑟 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 − 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
As Medidas de dispersão ou variação
As medidas de dispersão têm como finalidade encontrar um valor que resume a
variabilidade de um conjunto de dados, pois o facto de algumas medidas de
localização serem iguais para alguns conjuntos de dados diferentes, não
significa, que as suas distribuiçðes sejam iguais. As medidas de dispersão são
medidas que mostram o grau de concentração dos dados em torno da média. As
principais medidas de dispersão são: variância, desvio padrão e coeficiente de
variação.
Amplitude total (AT): é a diferença entre o valor máximo e valor mínimo de um
conjunto de dados. AT= 𝑀Á𝑋 − 𝑀Í𝑁
Intervalo interquartil (IQ): é a diferença entre o terceiro quartil e o primeiro
quartil. IQ= 𝑄3 − 𝑄1
Variância (𝑺𝟐 )
A variância é aproximadamente a média dos quadrados dos desvios das
observaçðes em relação a média. Esta medida não deve ser interpretada de
forma directa porque está em unidades de medida da variável ao quadrado, o
que quase não faz sentido.
∑𝑛 ̅ 2
𝑘=1(𝑋−𝑋)
𝑠2 =
𝑛−1
Comparando diversas distribuiçðes a que tiver maior variância terá mais
dispersão.
Desvio padrão (𝑺)
O desvio padrão é a raiz quadrada positiva da variância.
𝑆 = √𝑆 2
Coeficiente de variação (𝑪. 𝑽)
É uma medida de dispersão relativa que elimina o efeito da magnitude dos
dados. Esta medida exprime a variabilidade em relação a média e é útil para
comparar duas ou mais distribuiçðes.
𝑆
𝐶. 𝑉 = × 100
𝑋̅
Exemplo resolvido.
1) Pretende-se estudar o índice de mobilidade dos munícipes a um hospital
público na Província de Luanda. Construa a correspondente tabela de
distribuição de frequências.
77700000223331112244
55557772226666444422
000033333333667755004
a) Construir a tabela de distribuição de frequências.
b) Calcular o valor da média aritmética.
c) Determinar e interpretar o valor da mediana. .
d) Determinar e interpretar o valor da moda.
e) Determinar a variância.
f) Determinar o desvio padrão.
g) Determinar o coeficiente de variação.
X: Mobilidade f.a f.r f.a.a f.r.a f.r%
0 11 0,18 11 0,18 18%
1 3 0,004 14 0,22 4%
2 9 0,14 23 0,36 14%
3 11 0,18 34 0,54 18%
4 7 0,11 41 0,65 11%
5 6 0,09 47 0,74 9%
6 6 0,09 53 0,83 9%
7 8 0,13 61 0,96 13%
Total 61 0,96 96%
a) Calcular o valor da média aritmética.
Resposta:
∑𝑛𝑖=1 𝑥𝑖 × 𝑛𝑖
𝑥̅ =
𝑛
(0 × 11) + (1 × 3) + (2 × 9) + (3 × 11) + (4 × 7) + (5 × 6) + (6 × 6) + (7 × 8)
𝑥̅ =
61
0 + 3 + 18 + 33 + 28 + 30 + 36 + 56 204
𝑥̅ = = = 3,3 ≈ 3
61 61
b) Determinar e interpretar o valor da mediana. (2V).
Resposta:
𝑛 = 61 𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 é í𝑚𝑝𝑎𝑟
𝑛 + 1 61 + 1
𝑃𝑀 = = = 31
2 2
A mediana é igual a 3 porque é o número cuja posição divide o conjunto
dos dados numéricos em duas partes iguais.
c) Determinar e interpretar o valor da moda. (1 V).
A moda é o (0 𝑒 𝑜 3) porque têm as maiores frequências absoluta.
d) Determinar a variância. (2V).
∑𝑛𝑖(𝑥𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1
(0 − 3)2 + (1 − 3)2 + (2 − 3)2 + (3 − 3)2 + (4 − 3)2 + (5 − 3)2 + (6 − 3)2 + (7 − 3)2
𝑆2 =
61 − 1
9 + 4 + 1 + 0 + 1 + 4 + 9 + 16 44
𝑆2 = = = 0,73
60 60
e) Determinar o coeficiente de variação.(1,5V).
Resposta:
𝑆 = √𝑆 2 = √0,73 = 0,85
𝑆
𝐶. 𝑉 = × 100
𝑋̅
0,85
𝐶. 𝑉 = × 100
3
𝐶. 𝑉 = 0,283 × 100 = 28,3%