0% acharam este documento útil (0 voto)
11 visualizações15 páginas

Testes Estatísticos e P-Valor: Guia Prático

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
11 visualizações15 páginas

Testes Estatísticos e P-Valor: Guia Prático

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 15

TESTES ESTATÍSTICOS E P-VALOR

APRESENTAÇÃO DA UNIDADE

Na 1ª unidade desta disciplina foi discutido o conceito e os tipos de


hipóteses. Trata-se de uma afirmação categórica (suposição) que tenta
responder a um problema levantado no tema escolhido para a pesquisa.
Todos os estudos devem se basear em uma hipótese, entretanto, como a
mesma ainda configura suposição, ou seja, um ponto de vista formado porém
sem comprovação, há a necessidade de testá-la para responder se haverá
aceitação da hipótese nula ou alternativa.

Os testes estatísticos também são conhecidos como testes de hipótese


e vão auxiliar na análise e interpretação dos dados coletados em uma
pesquisa. Assim, nesta unidade nós estudaremos alguns dos principais testes
estatísticos, além das suas aplicações e como interpretar os resultados
oriundos destes. Veremos, também, o conceito e interpretação de um
indicador de probabilidade conhecido como p-valor.

Também vale ressaltar que esta apostila foi construída utilizando-se de


linguagem o mais simples, possível, para o melhor aprendizado de vocês e
vale salientar a importância de todos acessarem os materiais
complementares indicados ao longo de todo o material.

No mais, quaisquer dúvidas podem ser sanadas com auxílio do(a)


tutor(a). Bons estudos e um ótimo aproveitamento dos materiais.
SUMÁRIO

P-valor ............................................................................................................................ 4

Comparação de médias ............................................................................................ 7

Associação entre variáveis qualitativas ................................................................ 10

Correlação .................................................................................................................. 13

Referências ................................................................................................................. 15
4

P-valor

Testes estatísticos, também conhecidos como testes de hipótese, vão


indicar se o pesquisador deve aceitar a hipótese alternativa ou hipótese nula
ao testar a relação entre dois ou mais fenômenos.

Normalmente quando aplicados os testes, o indicador gerado que


auxilia na interpretação do resultado e que indica qual hipótese deve ser
aceita é o p-valor. Calcular o p-valor é bastante difícil, sendo por isso que
atualmente isso só é feito em programas de computador.

P-valor significa valor da probabilidade e, segundo Vieira (2018), P-valor


diz o quão provável seria obter uma amostra tal qual a que foi obtida quando
a hipótese nula for verdadeira. Isso quer dizer que quanto maior for o P-valor,
maior é a probabilidade da hipótese nula ser verdadeira, ou seja, maior é a
probabilidade da relação entre os fenômenos estudados não existir.

Quando o p-valor é elevado, considera-se que o resultado avaliado


não é estatisticamente significante e o contrário também é verdadeiro, assim,
quando o p-valor for baixo considera-se um resultado estatisticamente
significante.

Este indicador de probabilidade que é gerado com a aplicação de


testes estatísticos permite decidir se há evidência científica suficiente para
aceitar ou rejeitar a hipótese nula, embora os testes não sejam isentos de
erros. Nesse contexto, os pesquisadores sentem segurança para rejeitar a
hipótese nula quando o p-valor for baixo, ou seja, P < 0,05 (resultado
estatisticamente significante) e quando for muito baixo, ou seja, P < 0,001
(resultado altamente significante).
5

Fonte: Portal Deviante

Material complementar
Através deste link você poderá assistir a um vídeo em
que a Prof. Fernanda Maciel explica mais sobre o
significado e a interpretação do p-valor.

Exemplo
Um pesquisador em uma amostra de pessoas testou a associação entre as
variáveis sexo e anemia, tendo observado que 29% das mulheres avaliadas
possuíam anemia, enquanto 22% dos homens tinham a condição. Diante
disso, observando apenas esses percentuais, pode-se concluir que a
prevalência de anemia é maior entre as mulheres quando comparadas
aos homens na amostra em questão. Quando aplicado o teste de
associação adequado, foi observado um p-valor = 0,023, o que indica
significância estatística, já que o p < 0,05. Assim, conclui-se que a anemia
está associada ao sexo, mais especificamente ao sexo feminino que foi o
grupo que apresentou prevalência maior. Além disso, considera-se que os
percentuais comparados (22% e 29%) são estatisticamente diferentes.
6

Observe que no primeiro exemplo (p < 0,05) foi concluído que as variáveis
estavam associadas, já no segundo exemplo (p > 0,05), as variáveis não se
associaram. Dessa forma, no primeiro caso o pesquisador deve aceitar a
hipótese alternativa, já no segundo caso aceita-se a hipótese nula.

Ao imaginar o universo de testes estatísticos que podem ser aplicados


na análise de dados, há uma divisão muito conhecida:

Exemplo
Seguindo na mesma linha de exemplo, observa-se desta vez que a
prevalência de anemia em homens e mulheres foi de 26% e 30%,
respectivamente. Quando aplicado o teste estatístico mais adequado,
obteve-se um p-valor = 0,079. Assim, considerando que o p > 0,05, conclui-
se que ambas variáveis não estavam associadas. Além disso, entende-se
que a diferença observada entre os percentuais comparados (26% e 30%)
ocorreu ao acaso, sendo eles semelhantes.

Estatística Univariada

Estatística Bivariada

Estatística Multivariada

A estatística univariada engloba todos os métodos de estatística


descritiva, em que as variáveis são descritas individualmente, além da
estatística inferencial que vai analisar apenas uma variável na mesma
7

amostra ou em diferentes amostras. Os principais representantes desse grupo


são a análise de variância simples (conhecida pela sigla ANOVA – Analysis of
Variance) e o teste t de Student.

Já a estatística bivariada inclui a análise de duas variáveis diferentes,


podendo ou não ser estabelecida uma relação de causa/efeito entre elas.
São exemplos bem conhecidos de análise bivariada os testes do Qui-
quadrado (X²), os testes de Correlação, além da Regressão Linear Simples.

Por fim, a estatística multivariada inclui a análise de múltiplas variáveis


dependentes e independentes. Em outras palavras, a multivariada vai permitir
a análise de um número maior de variáveis ao mesmo tempo, constatando a
relação ou não entre elas. Além disso, na análise multivariada é possível a
correção dos resultados pelos possíveis fatores de confusão.

Se liga!
É interessante que você entenda um pouco mais sobre a
diferença entre variáveis dependentes e independentes,
além de compreender o que significa uma variável de
confusão. Você pode obter mais explicações sobre esses
temas clicando aqui (dependentes x independente) e aqui
(variável de confusão).

Comparação de médias

O teste t de Student é o método mais utilizado para realizar a


comparação entre médias, permitindo verificar se há diferença com
significância estatística entre as médias de dois grupos.
8

Sendo assim, quando aplicado o teste t de Student e o p-valor > 0,05,


entende-se que as médias são semelhantes (aceita-se a hipótese nula) e que
a pequena diferença observada entre ambas ocorreu ao acaso. Já quando
o p-valor < 0,05, entende-se que as médias são estatisticamente diferentes
(aceita-se a hipótese alternativa) e que a diferença observada entre elas não
ocorreu ao acaso.

Exemplo
Um pesquisador tem como objetivo analisar se as médias de Triglicerídeos
(TG) são diferentes em duas amostras, uma com consumo adequado de
Ômega-3 e outra com consumo inadequado do nutriente. Assim, ao
comparar as duas amostras, foi visto que a média de TG = 140 mg/dL no
grupo com consumo adequado de ômega-3 e TG = 156 mg/dL no grupo
com consumo inadequado de ômega 3. Ao aplicar o teste t de Student
para comparação das duas médias foi observado um p-valor = 0,001.
Diante disso, conclui-se que há um resultado altamente significante e que
as médias são estatisticamente diferentes (aceita-se a hipótese
alternativa). Por outro lado, se o p-valor fosse > 0,05, as médias seriam
consideradas semelhantes e que a pequena diferença entre elas ocorreu
ao acaso.

Nesse contexto de comparação de médias de uma variável para


grupos diferentes, há dois tipos de amostras: pareadas (ou dependentes) e
não pareadas (ou independentes).
9

As amostras pareadas são aquelas em que há duas observações (uma


para cada amostra) em momentos distintos do tempo, sendo que as amostras
possuem uma ligação (pareamento) entre si.

Exemplo 1
Em um estudo houve a comparação de duas médias em uma mesma
amostra. Os pesquisadores aferiram, através de uma escala específica
para tal, a média de dor lombar em um mesmo grupo antes e após uma
série de intervenções com técnicas de quiropraxia (integrante da
medicina alternativa). Foi visto que a média de dor lombar reduziu (p-valor
= 0,035) após as intervenções.

Exemplo 2
Em um estudo houve a comparação de duas médias em amostras de
pessoas diferentes. Os pesquisadores aferiram, através de uma escala
específica para tal, a média de dor lombar em dois grupos, sendo que o
grupo 1 passou por intenvenções com técnicas de quiropraxia e o grupo 2
foi exposto a intervenções envolvendo técnicas de acupuntura. Para evitar
viéses os indivíduos participantes dos grupos foram pareados, ou seja, para
cada pessoa do grupo 1 havia outra pessoa com características
semelhantes no grupo 2 (mesmo sexo, além de idade, peso, altura [...]
semelhantes). Foi visto que a média de dor lombar reduziu ligeiramente (p-
valor = 0,253) no grupo 1 em comparação com o grupo 2, mas que não
houve significância estatística.

Observe que no exemplo 1 houve a comparação do mesmo grupo de


pessoas em dois momentos diferentes do tempo. Isso significa que foram
utilizadas amostras pareadas de medidas repetidas. Já no exemplo 2 houve
a comparação entre pessoas distintas, porém pareadas em relação a
10

algumas características importantes. Esse caso configura uma análise de


amostras pareadas de pares emparelhados.

Por fim, quando os indivíduos das amostras não têm relação entre si,
não sendo as mesmas pessoas comparadas em momentos distintos ou pares
emparelhados por características importantes, trata-se de uma amostra ou
amostras não pareadas (independentes). Grande parte dos estudos utiliza a
comparação de amostras independentes para testar hipóteses.

Material complementar
O outro tipo de análise univariada bastante conhecida
é a ANOVA (análise de variância), como explicitado
anteriormente nesta apostila. Para entender mais sobre
a ANOVA, clique aqui.

Associação entre variáveis qualitativas

Há três principais tipos de testes (na análise bivariada) que podem ser
utilizados para testar a associação entre duas variáveis qualitativas:

Qui-quadrado de Pearson

Qui-quadrado para Tendência

Exato de Fisher
11

Esses testes são aplicados para avaliar a significância estatística


utilizando na análise as chamadas tabelas de contingência (faz o cruzamento
de variáveis qualitativas, por exemplo), sendo que cada um deles possui
algumas especificidades. Veja um exemplo de tabela de contingência que
poderia servir como base para aplicação destes testes:

Fonte: Portal Medstatweb

O primeiro, conhecido como Qui-quadrado de Pearson, geralmente é


utilizado para testar a associação entre variáveis dicotômicas, ou seja,
aquelas que possuem duas categorias cada. Apesar disso, muitos
pesquisadores também aplicam esse teste para avaliar a associação entre
variáveis com mais de duas categorias, desde que não sejam categorias
ordinais.

Quando pelo menos uma das variáveis apresenta a classificação de


qualitativa ordinal, ou seja, quando as categorias seguem uma ordem
estabelecida, o teste visto como mais aplicado na literatura é o Qui-
quadrado para Tendência.

Já o teste Exato de Fisher é apropriado para verificar a associação entre


variáveis dicotômicas (apenas dicotômicas) em amostras pequenas, ou seja,
com menos de 40 elementos. Entende-se que se aplicarmos o Qui-quadrado
de Pearson em amostras pequenas (N < 40), os valores de p são subestimados,
sendo mais adequado a aplicação do Exato de Fisher para evitar equívocos
na tomada de conclusões.

Observe a imagem abaixo retirada do estudo de Santiago et al. (2019):


12

Observe que estão destacados os valores de p de duas associações:


(tabagismo ativo x hipertensão e tabagismo passivo x hipertensão). Veja que
as duas associações apresentaram significância estatística, ou seja,
demonstraram um p-valor <0,05. Sendo assim, se pode concluir que, por meio
desta análise bivariada, o tabagismo ativo e passivo estavam associados à
hipertensão. Além disso, observe no rodapé da tabela uma nota informando
que foi aplicado o Teste do Qui-quadrado de Pearson nas análises dispostas
no material.

Material complementar
Recomenda-se como complemento a leitura do artigo científico
que pode ser acessado através deste link. Os autores utilizaram
o Teste do Qui-quadrado nas análises desse estudo, sendo uma
interessante leitura para aprender mais à respeito do contexto
de aplicação desse teste.
13

Correlação

A correlação é um tipo de teste bivariado que pode ser aplicado para


avaliar a relação entre duas variáveis quantitativas. Há dois tipos de
correlação: a de Pearson e a de Spearman.

O primeiro tipo de correlação (Pearson) é aplicado quando os dados


das variáveis quantitativas possuem distribuição normal, já o segundo
(Spearman) é aplicado quando os dados possuem distribuição não normal.

Se liga!
Em caso de dúvidas à respeito da distribuição normal e não
normal de dados, basta consultar novamente a página 14
da apostila da 3ª UNIDADE. Nesse ponto da apostila foi
abordado à respeito da normalidade da distribuição
(distribuição gaussiana).

Quando aplicado o Teste de Correlação (qualquer uma dos dois tipos),


normalmente são gerados dois indicadores: r (coeficiente de correlação) e p-
valor (probabilidade). Quanto ao p-valor, já foi discutido neste material como
fazer a interpretação, que nesse caso da correlação permanece da mesma
forma. Já em relação ao coeficiente de correlação, trata-se de um indicador
que vai medir o grau de correlação entre duas variáveis quantitativas e
indicar o comportamento das variáveis (positivo ou negativo).

O coeficiente de correlação, representado pela letra r, pode variar


entre -1 até +1. Quando o coeficiente é positivo, os dados das duas variáveis
quantitativas seguem na mesma direção (ou crescem ou reduzem juntas) e
quando o coeficiente é negativo, os dados seguem em direções opostas.

Ou seja, em uma correlação positiva, a medida em que os valores da


variável X crescem, os valores da variável Y crescem. Também é possível
observar em uma correlação positiva os valores da variável X reduzindo e os
valores da variável Y reduzindo também. Já no tocante a correlação
14

negativa, a medida em que os valores da variável X crescem, os valores da


variável Y reduze (ou vice-versa). Vale lembrar que, nesses exemplos, as
variáveis X e Y estão sendo comparadas através de um dos testes de
correlação.

Além desse comportamento positivo ou negativo explicitado acima, o


coeficiente de correlação também pode ser categorizado em graus
diferentes de correlação. São eles: ausência de correlação; correlação
baixa; correlação moderada;correlação forte; e correlação muito forte. Os
pontos de corte podem ser consultados na imagem a seguir:

Fonte: Mukaka (2012)

Dessa forma, se um coeficiente de correlação for r = 0,561 trata-se de


uma correlação positiva moderada. Mas se um coeficiente for r = - 0,759 trata-
se de uma correlação negativa forte.

Lembre-se que os pontos de corte descritos na imagem acima se


aplicam a correlação positiva e negativa da mesma forma. Só variam as
classificações de acordo com o grau. Outra informação que vale a pena
chamar atenção é que geralmente quando uma correlação apresenta r <
0,30 o p-valor também é p > 0,05, indicando que não há significância
estatística.
15

Material complementar
Recomendo como leitura complementar o artigo que pode ser
acessado através desse link. Nesse estudo os pesquisadores
utilizaram a correlação para fazer a análise de dados.

Material complementar
A análise multivariada é uma das mais complexas e
importantes que há. Esse tipo de estatística permite a
análise de uma maior quantidade de variáveis ao
mesmo tempo. Nesse link você poderá assistir a uma
videoaula à respeito dos métodos estatísticos
multivariados.

Referências

BERGAMASCHI, Denise Pimentel; SOUZA, José Maria Pacheco; BRAGA,


Patrícia Emília. Introdução à Bioestatística. São Paulo, 2005. [Material de
apoio Didático de Curso de Atualização do Programa de Verão da
Faculdade de Saúde Pública da Universidade de São Paulo].

DE OLIVEIRA FILHO, Petrúnio Fagundes. Epidemiologia e bioestatística –


fundamentos para uma leitura crítica. Editora Rubio, 2015.

MUKAKA, Mavuto M. A guide to appropriate use of correlation coefficient in


medical research. Malawi medical journal, v. 24, n. 3, p. 69-71, 2012.

VIEIRA, Sônia. Introdução à bioestatística. Elsevier Brasil, 2015.

_______. Bioestatística: tópicos avançados. Elsevier Brasil, 2018.

Você também pode gostar