Tipos de Variáveis
Tipos de Variáveis
2
5
3
6
7, 1
13,9
4,0
ÜAdos QUANTiTATivos
! 6 2,9
2 9 3,9
4 2,2
2 3 5,8
2 5 2,8
2 5 4,5
2 4 5,8
3 8 3,9
2
3
3
7
3
5
5
2,8
1,3
3,9
5,0
Q uando a variável em estudo for mensurada numericamente, temos
grande ganho em termos de técnicas de análise exploratória de dados.
Este capítulo trata da construção de distribuições de frequências de
1 5 0,1 variáveis quantitativas, bem como das interpretações que podemos fazer
2 3 4,6
2 4 2,6 sobre essas distribuições.
1 6 2 ,3
2 5 4,9
5 2,3 Uma variável quantitativa é dita discreta quando seus possíveis valores puderem ser listados.
3 3 ,9
! 4 2,1 O rulmero de filhos de um casal e o número de cômodos de uma casa
4 2,7
2 5 11, 1 são exemplos de variáve is discretas, pois a primeira só pode assumir
6 6,4 valores no conjunto {O, l, 2 , ...}, enquanto a segunda no conjunto {l, 2,
3 7 25,7
4 0,9 3, ...}. As variáveis discretas geralmente resultam de alguma contagem.
3 5 3,9
5 5, 1 Uma variável quantitativa é dita contínua quando puder assumir qualquer valor num
2 6 4,2
i 6 4,4 intervalo.
! 7 7,9
i 4 4,2
4 3,5 O peso de um indivíduo é uma variável contínua, pois pode assumir
2 6 11,4 qualquer valor no intervalo, digamos, de O a 300 kg. As variáveis contínuas
=-:e= âa familia pesquisada. costumam ser geradas por um instrumento de mensuração.
1 Quando a variável apresenta grande número de diferentes valores, podemos usar os artificios
que descreveremos para variáveis contínuas (Seção 5.2).
~ ' \s Ci~NCiA~ SociAis CAphulo S - D11dos QUA'ITir11 1ivos 81
a) b)
-'"'-'-..- co:isiderando uma UI
ai 14 14
-e:::icial Monte Verde ·o
..,
d 12
10
12
'O
·e;;
.,.... 10' -~
•<l
10
.,
"«!
8
1 86
<.>
'O
·o
.
(!)
e:., ·o 4
,5:;,
2
i
~
o ~
.:: o
2
2 3 4 5 6 7 8
2 3 4 5 6 7 8
Númer o de pessoas residentes ~de pessoas residentes
-=..:: ;x:ssoas residentes Figura 5.1 Representações gráficas da distribuição de frequências da Tabela 5. L
- --cias do Conjunto
;agem de residências
2,5 ExeRcícios
7,5
15,0 1) Observando a Figura 5.1, descreva qual a quantidade típica (ou faixa típica)
32,5 de moradores por domicílio. Existe algum domicílio muito diferente dos demais,
27,5 em termos do número de moradores?
lO,O
0,0 2) Considerando os dados do anexo do Capítulo 2, faça os seguintes itens:
5,0 a) construa uma tabela de distribuição d e frequê ncias para o nível de
satisfação do aluno com o curso (item 3.g do questionário);
b) apresente essa distribuição sob forma gráfica e
c) interprete.
3) As duas tabelas de frequências seguintes referem-se às distribuições do
- -a..-a representar os número de filhos dos pais e dos avós maternos de uma amos tra de 212
alunos da UFSC, pesquisada p elos a lunos do Curs o d e Ciências Sociais,
-..ada (eixo vertical),
primeiro semestre de 1990.
Distribuição do número de filhos dos pais dos respondentes
representação N2 de filhos l 2 3 4 5 6 7 8 9 10 11 12
?:imeira consiste Frequência 10 45 32 50 23 23 9 7 6 2 3 2
~~=:!:=-~~ cbservados (Figura
_ ____,,.._---... à frequê ncia do
Distribuição do nú mero de filhos dos avós matemos dos respondentes
s:::::..::sd~imos os riscos
N2 de filhos 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
- mesma largura
-~:-a
~) deve sempre
Frequência 2 17 32 17 29 23 2 0 22 21 14 8 6 2 4 o 1 o
..:..~el) pode iniciar
Apresente e ssas duas dis tribuições em gráficos e faça uma descrição
comparativa entre elas.
82 EsTATÍSTiCA ADliCAdA Às CiÊNCiAs SociAis CApfrulo 7 - DAdos 9~ ~~--
• •
1,5
• •
2,0
• • -• •
2,5
1 •
3,0
.. 57,25
72,81
54,70
59,07
76,85
66,0 1
67,95
68,04
Figura 5.2 Construção de um diagrama de pontos.
Observe que 1
menor valor é 45.3 ...,. e
É possível colocár duas ou mais distribuições num mesmo gráfico;
classes mutuame:!::~ ,_
basta identificar os pontos com símbolos diferentes , ou colocá-los em
todos os valores. :.:~
. ..
níveis diferentes, como ilustra a Figura 5.3 .
com amplitude ªP-' ·' ai
Sul • : * ..... * •. de 40,00 a .;!9 ~
Norte 1•
0,52
• •
0,62
1
IOH
-·· •• 1
0,72
• • • 1
0,82
>
•
3,0
.. 57,25
72,81
54,70
59,07
76,85
66,01
67,95
68,04
92,90
90,52
69,91
73,22
89,07
87,94
95,02
95,34
75,49 84,33
58,88 86,34
77,62 57,14
88,40 83,52
65,28
45,37
91,22
64,1 9
94,59
81 , 15
64,65
64,17
71,20
94,83
85,70
95,34
82,30
81,42
81,34
84,66
45,37 95,34
O polígono de freq-_ -
Classes: Para construí-lo, toma-se e
1 1 )
de cada classe. Coloc~
40 50 60 70 RO 90 100
~ Quando as classes não têm a
4 Quando se têm valores discrepantes no conjunto de dados, recomenda-se que o número por exemplo, Bussab e Mm~
de classes seja maior. u sando percentagens no ei.w
_ ..\d.\ i\s CiÊNciAs SociAis 85
HiSTOCjRl\MI\
:::2J:a de alfabetização,
A Figura 5.4 mostra um histograma de frequências, construído a
::as-_eiros, ano 2000 .
partir da Tabela 5.2. São retângulos justapostos, feitos sobre as classes
Percentagem da variável em estudo. A altura de cada retângu lo é proporcional à
de municí ios
2,5 frequência observada da correspondente classe. 5
12,5
20,0 12
15,0
30,0 (/)
o
20,0 "Si 10
100,0 :§
e
;:J 8
.,. ::equências é uma s
"""!3is classes podem 6
.a a distribuição de
_ãenciar algumas 4
. =sa...'11 muitas classes,
t:tos relevantes da 2
s. dependendo da 40 50 60 70 80 90 100
Taxa de alfabetização
Figura 5.4 Histograma de frequências de valores da taxa de alfabetização,
relativos a uma amostra aleatória de municípios brasileiros, ano 2000.
PolíqoNo dE fREOUÊNCiAs
"'o. 12 -
-~ É comum
:g 10 - simétricas. Por e::==:
5 assimétricas, pois e. ·;:
E 8-
"'
-o com alta renda (pr::. _
~ 6 -
"õ
,.,>:: 4,
;J
O'
~
ti: 21
o- í'
30 40 50 60 70
Ta.x a de alfabetização
80 90 100 1 10
_)__
Figura 5.5 Polígono de frequências de valores da taxa de
alfabetização, relativos a uma amostra aleatória de municípios
brasileiros, ano 2000.
o 5 10 15 20 25 30
Renda familia r (c m :;a.lúrios minimos)
- .l>~
~ :zta
--o
de
__
_ /·) \>.. _ _
::::::dpios (e) Distribuição simétrica (d) Distribuição assimêuica
ExERCÍcios
4 ) Os dados a seguir são medidas da identidade social que os professores sentem
em relação ao seu departamento de ensino. Foram observadas duas amostras
de 12 professores: uma no Departamento de Engenharia Mecânica e a outra
= no Departamento de His tória, ambas na UFSC. Pelo instrumento utilizado,
pode-se dizer que quanto maior o valor, maior é a identificação social do
professor com o departamento de ensino a que pertence.
Valores de identidade social
_.:;: 30
Departamen to de Eng. Mecânica Departament o de Histõria
4 6 48 47 48 49 50 35 24 43 4 3 44 33
3 7 46 47 48 44 47 38 35 39 37 40 35
Fonte: Laboratório de Psicologia Social / UFSC, 1990.
~
~ 15
30~
8 25
20
g
l
40
50UL
30 O leitor deve
·.;; 10
,, 5
.,
-~ 20
,, 10
se a forma da distr..o.>-..... ._
.,. o .1.....-.1.._..___.__,___.____.___._~- $ o _.___.__ _,__,__..__.__..____.__..____ d eitado (compare e
9 10 11 12 13 14 15 16 16 20 24 28 32 36 40 44 Figura 5.4).
pressão inlfaocufar pressão intraocular
5J RAMO--E--fol~As
Quando a quantidade de dados não for muito grande (digamos, até res. Em nosso exe-
uma centena de observações), podemos construir, com relativa facilidade, igual a 1 (um), ou se:.,,_
um ramo-e-folhas, o qual fornece a forma da distribuição de frequências e naturalmente, e me:-=.:__
ainda preserva a magnitude aproximada dos valores. Num ramo-e-folhas, folha. Por exem plo ~ . -
os dados ficam ordenados crescentemente, o que facilita a obtenção de
Na construçã~
algumas medidas descritivas, como veremos no próximo capítulo.
a escolha dos alga.-::::
Voltemos a considerar as taxas de alfabetização de uma amostra de d epende do c o~~~
municípios brasileiros. Para facilitar a construção do ramo-e-folhas, vamos análise . Tome mos
usar apenas os dois algarismos mais relevantes, desprezando os algarismos onde trabalharemos
decimais.
Dados da poptta· -
Para cada valor, o primeiro algarismo é colocado do lado esquerdo 6.512 8.453 3"
do traço vertical, formando os ramos. O segundo algarismo é colocado do 3.682 19.985 •
18.084 13.084
lado direito do traço, formando as folhas. Assim, o valor 57 fica representado 17 .189 9.709
por 517 (veja a segunda linha da Figura 5.8a), o 76 por 716 (quarta linha), Fonte: IBGE.
e assim por diante . Na apresentação final de um ramo-e-folhas, devemos
também ordenar as folhas, como mostra a Figura 5.8b. cinco, temos a me=a o;,, ""
respectivamente).