Tipos de Investigação
Qualitativa:
- Pesquisa com um objetivo de explorar e responder a
questões de investigação e não o de testar hipóteses.
- Estuda os fenómenos no seu ambiente natural de forma a
compreendê-los.
Conceitos Estatísticos
- Pesquisa de natureza indutiva, i.e., recolha e análise dos
dados ocorre antes de desenvolvimentos teóricos. Variável:
- Característica em estudo que varia de indivíduo para
Quantitativa:
indivíduo.
- Tem como objetivo testar hipóteses de investigação
- Assume um valor único para cada indivíduo num
através da observação e medição direta das variáveis a
determinado momento temporal.
estudar.
- Método dedutivo, i.e., as hipóteses a testar decorrem de Caso:
modelos teóricos pré-existentes. - A unidade da análise de dados.
- A análise dos dados faz-se através de dados numéricos. - Por exemplo, um indivíduo, empresa, etc., que tenha
participado no estudo.
Utilidade da Estatística para as Ciências Sociais
Observação:
Responde-nos a dois desafios:
- O valor que determinada variável pode tomar para um
- O que é que o mundo e as evidências que encontramos
determinado caso.
nos dizem?
Estatística é a forma rigorosa de descrever as Dados:
evidências. - Conjunto de respostas recolhidas num dado estudo de
- Quão certos podemos estar acerca das nossas onde se podem tirar conclusões.
inferências acerca do mundo que nos rodeia?
Dados Omissos:
Estatística permite calcular a precisão das nossas
- Inexistência de resposta numa dada variável num caso
conclusões.
específico.
Investigação Quantitativa Variáveis Estatísticas e Escalas de Medida:
- Podem assumir uma natureza qualitativa e quantitativa em
função do tipo de dados que representam:
- Variável Qualitativa (ou Categórica): remete para
características que estão classificadas em grupos ou
categorias (e.g., a cor dos olhos, a classe social)
mutuamente exclusivos.
- Variável Quantitativa (ou Numérica): remete para
características passíveis de serem contadas ou medidas
expressas por valores numéricos com significado próprio, - Amostra: na impossibilidade de se estudarem todos os
permitindo a constituição de diferentes operações elementos de uma dada população restringe-se a sua
numéricas (e.g., a altura, o peso, o número de irmãos). dimensão recolhendo uma amostra da população; os
- Cada tipo de variável pode ser expressa em diferentes valores utilizados para designar uma amostra são
escalas de medida. estatísticas.
- As variáveis qualitativas são expressas em: - Amostragem: método de seleção dos participantes de
- Escalas Nominais: representam características uma amostra.
integradas em pelo menos duas categorias que sem - Amostragem Probabilística: a amostra deverá ser
qualquer ordem intrínseca entre si (e.g., religião, representativa da população e assente em métodos de
profissão); quanto têm apenas duas categorias aleatorização assegurando-se que cada elemento da
designam-se de dicotómicas. população tem igual probabilidade de ser incluído na
- Escalas Ordinais: representam características incluídas amostra (e.g., amostra aleatória simples, amostra por
em grupos ou categorias ordenadas entre si (e.g., clusters).
escalas de Likert, classificação numa prova, classe - Amostragem Não-Probabilística: a amostra não é
social). constituída tendo por base princípios de aleatorização,
- As variáveis quantitativas são expressas em: mas sim a facilidade em aceder a participantes podendo
- Escalas Intervalares: representam valores cuja levar a amostras enviesadas comprometendo a
distância entre si tem um significado próprio e os seus generalização dos resultados para a população (e.g.,
intervalos a mesma interpretação (a distância entre 8 e amostra por conveniência, bola de neve).
10 é a mesma do que entre 43 e 45) mas o 0 não tem
Estatísticas Descritivas
valor absoluto (e.g., temperatura, escalas de Likert).
- Escalas de Razão: diferenciam-se das escalas Análises Estatísticas:
intervalares pois o 0 assume um valor absoluto (e.g., - Estatística Descritiva:
altura, peso). - Permite descrever padrões nos dados.
- Estatísticas básicas sobre os dados que recolhemos,
Papel das Variáveis:
caracterização dos dados.
- Variável Dependente (VD): é a variável que se vai medir
- Permite conhecer quais são os valores médios e a
para avaliar as diferenças nos sujeitos derivadas da
variabilidade que existem nos dados.
exposição (ou não) à VI; aquela que resulta ou depende de
- Estatística Inferencial:
outros fatores para ocorrer; representada por Y.
- Permite tomar decisões acerca do suporte (ou não) às
- Variável Independente (VI): variável explicativa ou
hipóteses.
preditora; aquela que será manipulada pelo investigador
- Usa os resultados de uma amostra para estimar os
para produzir um dado efeito (em contexto experimental) ou
parâmetros da população.
utilizada para explicar/prever (em contexto correlacional)
- Permite calcular com precisão o grau de incerteza nos
um dado fenómeno; representada por um X.
resultados obtidos.
População e Amostra:
Estatística Descritiva:
- População: todo o conjunto de pessoas, objetos, eventos,
- A Estatística descritiva dos dados inclui:
procedimentos, etc, de interesse para um determinado
- Análise da distribuição de frequências (absolutas e
estudo; valores utilizados para designar uma população
relativas) de uma determinada variável e a sua
designam-se de parâmetros.
representação gráfica. 2) A maioria dos acontecimentos estudados em ciências
– Medidas de tendência central (e.g., média), não central sociais não têm igual probabilidade de acontecer. A cada
e de dispersão. acontecimento está associado um certo grau de
– Identificação de outliers e caracterização de não probabilidade:
respostas (missing values ou dados omissos). - Se um valor não pode ocorrer, é atribuída uma
probabilidade de 0%.
Medidas de Tendência Central, Não Central e Dispersão:
- Se um evento ocorre sempre, a probabilidade é de
100%.
3) Maior parte dos estudos não podem ser conduzidos
com a totalidade da população, mas sim com uma
amostra da população.
4) Uma distribuição de probabilidade possibilita tirar
Distribuição de Variáveis:
conclusões acerca da população e partir dos resultados
- É uma descrição do número relativo de vezes que cada
obtidos numa amostra, com um determinado grau de
resultado possível ocorrerá.
incerteza → objetivo da estatística inferencial.
- Muitas análises estatísticas pressupõem que os dados
5) Muitas variáveis em ciências sociais (e.g., psicologia,
seguem uma distribuição designada de distribuição normal.
educação) apresentam uma distribuição próxima da
- Quando há distorções face ao que é considerado normal,
distribuição normal (e.g., habilidade de leitura, introversão,
a interpretação das análises estatísticas pode ser
satisfação no trabalho, memória, etc).
problemática.
6) Assumir a normalidade de uma variável permite
Distribuição Normal: calcular a probabilidade a priori de um acontecimento,
- Representação gráfica de um conjunto de observações cujo conjunto de resultados não é finito nem conhecido.
numa dada variável: eixo vertical – frequências; eixo
horizontal – categorias ou valores da variável.
- É representada por uma curva em forma de sino. Traduz a
distribuição mais comum em variáveis que são
influenciadas por múltiplos fatores separados, como é o
caso da maioria das variáveis que os psicólogos
investigam..
- Importância da Distribuição Normal: Medidas de Distribuição:
1) Quando queremos prever um determinado - Aplica-se a variáveis quantitativas e caracterizam a forma
acontecimento, precisamos de entender o comportamento como a distribuição dos dados se encontra em torno da
da variável que estamos a estudar, i.e., é importante média de cada variável.
conhecer os resultados possíveis dessa variável.
- Pico bastante acentuado.
- Pouca variação nos dados.
Estatísticas Descritivas no JASP:
- Importantes para aferir em que medida as variáveis
- Exemplo 1:
diferem de uma distribuição normal – um dos principais
pressupostos distribucionais associado aos procedimentos
estatísticos paramétricos.
Assimetria das Variáveis:
- Grau em que a curva de frequências é desigual: os valores
da média, mediana e moda não coincidem e as caudas da
distribuição não são iguais.
- Frequentemente, a assimetria resulta do uso de medidas
enviesadas.
- Assimetria elevada pode influenciar as análises
estatísticas.
Curtose de Variáveis:
- Grau em que a curva de frequências é íngreme ou plana.
- Um valor 0 de curtose indica ausência de curtose, o que
ocorre numa distribuição normal.
- A curtose tem pouca influência nas análises estatísticas
usadas.
- Exemplo 2:
- Distribuição Platicúrtica:
- Valores negativos de curtose.
- Não se verifica um pico.
- Muita variação nos dados.
- Distribuição Mesocúrtica:
- Curtose com valor 0.
- Distribuição normal.
- Nem achatada nem alongada.
- Distribuição Leptocúrtica:
- Valores positivos de curtose.
- Hipóteses Estatísticas:
- A hipótese nula (H0) é a hipótese sobre a qual se deve
obter evidências para a rejeitar.
- Afirmação escrita na forma de uma igualdade (=).
- A hipótese alternativa (H1) é a hipótese sobre a qual se
deve obter evidências para a aceitar.
- O contrário de H0, afirmação escrita na forma de
uma diferença (≠).
- Exemplo 3: - Exemplos:
- Será que existem diferenças entre homens e mulheres
no que diz respeito à produtividade no trabalho?
- Hipóteses:
- H0: Não há diferenças entre homens e mulheres na
produtividade no trabalho.
- H1: Há diferenças entre homens e mulheres na
produtividade no trabalho.
- Será que a idade influencia a capacidade de adaptação
Estatísticas Inferenciais à mudança em contexto laboral?
- Hipóteses:
Objetivo: estudar as características de uma população ou
- H0: A idade não influencia a adaptação.
universo a partir da observação de uma amostra.
- H1: A idade influencia a adaptação.
- Sabemos se aceitamos ou rejeitamos H0 analisando a
probabilidade associado ao teste estatístico → p-value.
P-value:
- A probabilidade do resultado que obtivermos se dever ao
Teste de Hipóteses: acaso denomina-se de p-value e varia entre 0 e 1.
- Procedimento estatístico que usa amostras e variáveis da - Se a probabilidade do resultado se dever ao acaso for
amostra para testar hipóteses acerca de variáveis da elevadas → resultados não são estatisticamente
população, associando um grau de incerteza a esse teste. significativos → não rejeitamos a hipótese nula.
- Se a probabilidade do resultado se dever ao acaso for
Incerteza/erro → Probabilidade baixa → resultados são estatisticamente significativos →
(quantifica o erro) rejeitamos a hipótese nula.
Para qualquer evento A a probabilidade de este acontecer Nível de Significância (α):
está entre 0 e 1.
- Probabilidade estabelecida a priori como limite para
0 ≤ P(A) ≤ 1 decidir se rejeita ou não H0. Normalmente, α=0.05 ou
- Rejeitamos (ou não) uma determinada hipótese baseada α=0.01.
na probabilidade associada ao teste. - Se p ≥ α, efeito pode dever-se ao acaso, se p < α, efeito
- Se a sua probabilidade de ocorrência for muito reduzida,
não se deve ao acaso, mas sim ao que estamos estudar
concluímos que essa hipótese não deverá ser verdadeira. (estatisticamente significativo).
Grau de Confiança (1 – α):
- Grau de confiança (95%, 99% ou 99.9%) = 1 – α; onde
α é o nível de significância.
- Logo, para um grau de confiança de 0.95 (ou 95%) →
nível de significância é α=0.05.
Concluindo:
Testes Paramétricos e Não Paramétricos:
- Recorremos a testes paramétricos quando a distribuição
da amostra é uma distribuição normal e a testes não
paramétricos quando a distribuição não é normal.
Teste à Normalidade Shapiro-Wilk:
- O teste de Shapiro-Wilk é um teste estatístico utilizado
para verificar se uma variável contínua segue uma
distribuição normal.
- A hipótese nula (H0) afirma que a variável segue uma
distribuição normal, enquanto a hipótese alternativa (H1)
afirma que a variável não segue uma distribuição normal.
- Após realizar este teste:
- Se p ≤ 0.05: então a hipótese nula pode ser rejeitada Teste T-Student
(ou seja, a variável não segue uma distribuição normal). Teste T para Uma Amostra (One-Sample T-Test):
- Se p > 0.05: então a hipótese nula não pode ser - Testa se a média de uma dada variável da amostra é igual
rejeitada (ou seja, a variável pode seguir uma distribuição à média (conhecida) da população.
normal). - E.g., idade da amostra é igual à da população que é igual a
- No JASP: 22.
Teste T para Duas Amostras Independentes (Independent
Sample T-Test):
- Testa se a média de dois grupos da amostra são iguais
entre si.
- E.g., o nível de ansiedade será igual entre homens e variância entre as amostras ou grupos (between groups-
mulheres. variância do factor).
Quanto maior a proporção de variância between groups em
Teste T para Duas Amostras Emparelhadas (Paired
relação à variância within groups, mais significativas as
Sample T-Test):
diferenças entre grupos.
- Testa se a média para a mesma amostra numa variável
medida em dois momentos são iguais. Exemplo → Poderão estas imagens/cenários estímulo
- E.g., foi medida a ansiedade antes e depois de uma originar diferentes níveis de ansiedade?
intervenção e pretende-se ver se a ansiedade diminuiu
após intervenção.
One-Way ANOVA
O que é a ANOVA?
- Análise de Variância (ANOVA):
- Conjunto de modelos estatísticos utilizados para
analisar as diferenças entre três ou mais médias de uma
amostra através da decomposição da variância.
- Vários modelos de Análise de Variância:
- One-way ANOVA: anova com um fator intersujeitos.
- Two-way ANOVA: anova fatorial.
- Repeated measures ANOVA: anova com um fator
intrasujeitos.
- ANOVA mista: com fator inter e intrasujeitos.
- MANOVA: com duas ou mais VDs.
Objetivo: comparação de médias de três ou mais grupos
independentes.
H0: µ1 = µ2 = … = µk = µ
H1: µi ≠ µ, pelo menos para um i → pelo menos uma das
médias dos grupos é diferente.
Pressupostos:
- VD quantitativa.
- VD com distribuição normal.
- VI categorial.
- Homogeneidade das variâncias.
- Amostras independentes entre si.
Testa a igualdade de médias através da comparação da
proporção relativa da variância dentro das amostras ou
grupos (within groups – variância residual/erros) com a
Exemplo → Será que a perceção dos indivíduos em
relação à sua própria classe social afeta o seu desejo de
terem um elevado estatuto na sociedade?
- Variável Dependente: desejo de elevado estatuto (variável
desires).
- Variável Independente: classe social familiar percebida
(variável GR_ClassFM; baixa vs. média vs. alta).
Espera-se reduzir a variância dentro das condições (erro
ou ruído):
- Variância entre condições (between conditions) >
variância dentro das condições (within conditions) →
efeito tem de ser maior que o erro.
Pretende-se que a variância provocada pela manipulação
das VI do modelo seja superior à variância causada por
outros fatores/ruído (e.g. diferenças individuais), ou
seja, a variância erro.
F = variância devido à manipulação da VI (sinal)/variância
(erro).
- Se o sinal for igual ao erro, o valor de F será igual a 1.
Exemplo no JASP → Existirá efeito da condição
experimental (ilha deserta, engarrafamento, sala neutra) se
os valores de ansiedade variarem mais entre as 3
condições, do que dentro de cada uma das condições!
Two-Way ANOVA ou ANOVA Fatorial
Analisar o impacto de várias variáveis independentes na
variável dependente.
Para além de efeitos principais passa, também, a testar-se
efeitos de interação (ou moderação) que decorrem da
relação entre todos os níveis dos fatores.
Este modelo permitiria explicar:
– O efeito principal do género na ansiedade.
– O efeito principal do ano da licenciatura na ansiedade.
– O efeito de interação entre o género e o ano de
licenciatura na ansiedade.
Com mais do que uma variável independente, posso testar
se estas interagem, afetando a minha variável dependente!
Por exemplo, no nosso exemplo em que pretendemos
estudar se o género (VI) e o ano de licenciatura (VI) se
combinam na forma como influenciam a ansiedade dos
estudantes (VD)… podemos vir a concluir que enquanto
num dos géneros a ansiedade aumenta ao longo do
curso, no outro diminui…
- Reportar Resultados: Terminologia:
- Verificou-se um efeito significativo da classe social na - Fatores → variáveis independentes.
vontade de obter estatuto elevado na sociedade (F(2, - Níveis → dentro dos fatores.
528) = 4.827, p = .008). Especificamente, verificou-
se que os participantes de classe social alta apresentam
um maior desejo de maior estatuto na sociedade (M=
4.83; DP = 1.31), do que os participantes de classe
social baixa (M= 4.38, DP = 1.43) e média (M= 4.43,
DP =1 .30).
Em estudos com mais de um fator, o foco de interesse é o eficaz em melhorar a satisfação dos funcionários quando a
efeito da interação (moderação) entre esses fatores na carga de trabalho é baixa, enquanto a liderança autocrática
variável dependente. possa ser mais eficaz em períodos de alta carga de
trabalho. Este resultado sugere assim que o efeito do estilo
A análise das interações é um ponto fundamental na
de liderança (autocrático versus democrático) na
investigação em psicologia.
satisfação dos funcionários pode variar dependendo da
Exemplo → Efeito de dois estilos de liderança (Liderança carga de trabalho dos funcionários.
Autocrática vs. Liderança Democrática) e a influência da
carga de trabalho (Alta vs. Baixa) na satisfação dos
funcionários.
- Objetivo: avaliar se os dois efeitos (liderança e carga de
trabalho) agem independentemente um do outro sobre a
variável dependente (satisfação dos funcionários) ou se,
pelo contrário, o efeito de um depende do efeito do outro
(interação ou moderação).
- Neste estudo, os participantes são funcionários de uma
organização que serão atribuídos a diferentes estilos de
liderança dos seus supervisores. Além disso, a carga de
trabalho dos funcionários será manipulada, com metade Análise do efeito de interação / moderação:
dos funcionários tendo uma carga de trabalho alta e a
outra metade tendo uma carga de trabalho baixa.
- Após um período de tempo, a satisfação dos funcionários
é avaliada por meio de questionário.
- Variáveis:
- Variável Dependente: Satisfação dos Funcionários
(medida por uma escala de satisfação no trabalho).
- Variável Independente 1: Estilo de Liderança Exemplo no JASP → Será que há diferenças entre
(Autocrático vs. Democrático). homens e mulheres no que respeita ao efeito da classe
- Variável Independente 2: Carga de Trabalho (Alta vs. social no desejo de terem um elevado estatuto na
Baixa). sociedade?
- A interação deve ser sempre interpretada em primeiro - Variável Dependente: desejo de elevado estatuto (variável
lugar, antes da interpretação dos efeitos principais. desires).
- Quando existe interação, não se pode falar dos efeitos - Variáveis Independentes: classe social familiar percebida
principais isoladamente, uma vez que o efeito de um fator (baixa vs. média vs. elevada; variável Gr_ClassFM); género
depende do efeito do outro. (homem vs. mulher; variável gender).
- Se não existe interação significativa, os fatores principais
podem ser interpretados isoladamente.
- Os resultados poderiam revelar uma interação
significativa entre o estilo de liderança e a carga de
trabalho, no sentido de que a liderança democrática é mais
- Reportar Resultados:
- Para explicar o desejo de estatuto dos participantes, foi
realizada uma análise fatorial 3 (classe social: baixa vs.
média vs. alta) x 2 (género: feminino vs. masculino) que
indicou a existência de um efeito principal da classe social
(F (2, 525) = 4.62, p=.010). Aqueles que se percebem
como classe social alta (M = 4.81, EP = 0.12)
apresentam médias superiores de desejo de estatuto em
relação aos de classe social média (M = 4.43, EP =
0.10) e baixa (M = 4.36, EP = 0.09). Foi ainda
encontrado um efeito principal do género (F (1, 525) =
3.99, p =.046), no sentido em que as mulheres (M =
4.41, EP = 0.09) apresentam um desejo de estatuto
inferior ao dos homens (M = 4.66, EP = 0.08). Não foi
encontrado nenhum efeito de interação entre as duas
variáveis (F (2, 525) = 2.24, p = .108).