Análisis de Datos y Estadística en Problemas
Análisis de Datos y Estadística en Problemas
nivel 2”
Unidad 5
APLICACIÓN DEL
ANÁLISIS DE DATOS, LA
ESTADÍSTICA Y LA
PROBABILIDAD EN LA
RESOLUCIÓN DE
PROBLEMAS
Manual Unidad 5
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Población: el conjunto de elementos o individuos que será el objeto de estudio. Por ejemplo si
vamos a estudiar la estatura de los jóvenes de 16 años nacidos en España, la población sería
precisamente el conjunto formado por dichos jóvenes
Muestra: es un subconjunto extraído de la población. Se usa cuando por algún motivo no sería
posible realizar el estudio sobre toda la población. El nº de elementos de la muestra se llama
tamaño de la muestra y cada elemento se llama individuo. El proceso de elección de la
muestra se llama muestreo. Se tomará una muestra cuando la población sea muy numerosa.
La muestra debe ser representativa de la población. En el ejemplo estatura de los jóvenes
mencionado anteriormente, elegiríamos una muestra formada por sólo algunos jóvenes, por
ejemplo, 1000 jóvenes (tamaño 1000). Para que la muestra fuese representativa de la
población habría que tomar hombres y mujeres y de todas las comunidades autónomas. Si,
por ejemplo, queremos estudiar la estatura de los alumnos de un aula no es necesario tomar
una muestra. En este caso tomaríamos toda la población pues hay “pocos” alumnos.
Variables: es el conjunto de valores que pueden tomar las propiedades o las características de
la población que queremos estudiar, y pueden ser:
Cualitativas: no se pueden expresar numéricamente por que los valores que se toman son
cualidades, por ejemplo: sexo, color favorito, partido político, edad...
2
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Ejemplos:
1. Para estudiar la evolución del cáncer de mama en la población femenina de un país, se puede
considerar que individuo es cada una de las mujeres residentes en el mismo, población es el
conjunto de todas ellas y una muestra se obtiene al observar el 1% del censo.
3. 21.845 estudiantes de la universidad San Onofre forman una población. Cada uno de ellos es
un individuo. Las variables que se pueden analizar en esta población pueden ser:
a) Facultad a la que pertenecen: medicina, ingeniería, matemáticas, etc.
b) Sexo, edad, estatura, peso, color de los ojos, etc.
c) Número de años que están cursando, años que han repetido, etc.
d) Lectura, música, asignatura, tipo de películas preferidas, etc.
Las variables que se estudian son de los siguientes tipos:
Facultad, sexo y tipo de lectura: cualitativas.
Número de años matriculado: cuantitativa discreta.
Estatura, edad: cuantitativa continua.
Si se realiza una encuesta de 375 alumnos de esta universidad, el colectivo formado por esos
alumnos representa la muestra.
Ejercicio:
Deseamos hacer un estudio comparativo de aspectos relevantes de distintos países del mundo,
donde se tenga en cuenta el número de habitantes, la renta per cápita, religión predominante,
número de ciudades con más de 300.000 habitantes. En este estudio estadístico indica:
¿Cuál es la población? Solución: el número de países que tengamos en cuenta.
¿Cuáles son los individuos? Solución: cada uno de los elementos que forma la muestra.
¿Cuáles son las variables y de qué tipo son?
Solución:
Número de habitantes. Cuantitativa.
Renta per cápita. Cuantitativa.
Religión. Cualitativa.
Número de ciudades con más de 300.000 habitantes. Cuantitativa.
3
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
4
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
La estadística, como hemos dicho, es una rama matemática que nos permite agrupar datos y
extraer conclusiones en base a estos. Así se pueden recoger datos de medios de comunicación y
elaborar conclusiones de la vida cotidiana. Posteriormente para que sean más fáciles de entender
se elaboran tablas de valores, y gráficos, (las dos formas más comunes de representación de
datos) y porcentajes. Cuando se analiza una variable, la información resultante de la muestra se
encuentra resumida habitualmente en una tabla o distribución de frecuencias.
Definición. Una tabla de valores o de frecuencias es una tabla que relaciona dos magnitudes
mediante la agrupación de datos.
3. Cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que será
necesario agrupar en intervalos los valores de la variable. Ejemplo, aquí tenemos una tabla
del instituto nacional de estadística sobre la compra por Internet en los hogares españoles.
En este caso las magnitudes expresadas son el tiempo y el uso o no uso de las tecnologías
(expresado en porcentaje)
5
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS.
1. En un albergue juvenil hay 48 adolescentes y 200 veinteañeros. De los adolescentes 32 usan el
tren para desplazarse en largas distancias. De los veinteañeros, 40. Construye una tabla.
Solución:
Adolescentes Veinteañeros
Tren 32 40
Otro 16 160
Total 48 200
Solo 28 50
Acompañado 12 50
Total 40 100
6
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
MUESTRA
En la práctica, es muy frecuente tener que recurrir a una muestra para inferir datos de la población por
alguno o varios de los siguientes motivos:
La población es excesivamente numerosa (datos de la población de un país en relación a estatura,
peso, estudios, edad, posición social, etc.)
La población es muy difícil, o imposible de controlar (deseamos conocer la opinión sobre el resultado
de un determinado acontecimiento deportivo, es imposible preguntar a todas las personas que
acuden al evento)
El proceso de medición es muy difícil de lograr o demasiado caro (cuántas horas dura un ordenador
de sobremesa)
Se desea conocer rápidamente ciertos datos de la población y se tardaría demasiado en consultar a
todos, por ejemplo, un sondeo electoral.
Si el tamaño de la muestra es muy pequeño, no podremos extraer de ella ninguna conclusión fidedigna.
Al sustituirse el estudio de la totalidad de la población por el de la muestra, se cometen errores que
deben ser controlados. Por eso es necesario que la muestra sea representativa. El proceso de confección
de una muestra se denomina muestreo.
El muestreo es aleatorio por que los individuos de la muestra se eligen al azar, es decir, que todos ellos
tienen la misma probabilidad de ser elegidos.
Definidas las variables a estudiar será necesario trabajar con la muestra elegida recogiendo los valores
de la variable. Para ello seleccionaremos el método de investigación (dependiendo del tipo de
información que deseamos y la población en la que nos centraremos) podemos usar:
Métodos cuantitativos (encuestas y cuestionarios)
Métodos cualitativos (entrevistas personales, grupos de debate…)
CUESTIONARIOS
Definición. Un cuestionario consiste en un conjunto de preguntas respecto a una o más variables a
medir.
El contenido de las preguntas de un cuestionario puede ser tan variado como los aspectos que mida. Y
básicamente, podemos hablar de dos tipos de preguntas: cerradas y abiertas.
Las preguntas cerradas contienen categorías o alternativas de respuestas que han sido delimitadas.
Es decir, se presentan a los sujetos las posibilidades de respuestas y ellos deben circunscribirse a
ellas. Pueden ser dicotómicas (dos alternativas de respuestas) o incluir varias alternativas de
respuestas.
Las preguntas abiertas ofrecen mayor libertad de respuesta al individuo.
ENCUESTAS
El diseño de encuestas parte de la premisa de que si, queremos conocer algo sobre el comportamiento
de las personas, lo mejor, lo más directo y simple, es preguntárselo directamente a ellas. Se trata por
tanto de requerir información a un grupo socialmente significativo de personas acerca de los problemas
de estudio para luego, mediante un análisis de tipo cuantitativo, sacar las conclusiones que se
correspondan con los datos recogidos.
7
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
ENTREVISTA
La entrevista es una forma específica de interacción social que tiene por objeto recoger datos
sobre un determinado tema. El investigador formula preguntas a las personas que proporcionan
los datos relativos a sus conductas, opiniones, deseos, actitudes y expectativas, que por su
misma naturaleza es casi imposible de observar desde fuera.
La entrevista puede ser de carácter muy abierto, o totalmente cerrada cuando se quiere tratar
alguna cuestión en particular. A diferencia del cuestionario siempre requiere la presencia del
encuestador.
Por tanto, los datos de la muestra también pueden obtenerse de la observación. En algunas
situaciones no es necesario preguntar a ningún individuo, sino que será necesario recurrir a la
observación, por ejemplo, cuantos árboles hay en un parque, limpieza o suciedad de una
determinada playa, etc. La opinión de la población se puede cuantificar mediante una encuesta
personalizada que indique lo que cada persona considera o aprecia al respecto.
MEDIR
Evidentemente, en otras ocasiones es necesario utilizar técnicas que permitan recoger la
información, como por ejemplo, medir, es decir, cuantificar el resultado o resultados obtenidos
(deseamos saber cuánto miden de media las cigüeñas). En estos casos será necesario utilizar un
instrumento de medida sobre el objeto o variable que queramos conocer.
Ejemplos de preguntas:
Por favor, marca con una X tu respuesta.
1. Sexo: Hombre ( ) Mujer ( )
2. Edad: 18 a menos de 28 ( ); 28 a menos de 38 ( ); 38 a menos de 48 ( ); 48 a menos de
58 ( ); 58 a menos de 68 ( ) 68 o más ________ especifique.
3. Antigüedad en la empresa:
Menos de 5 años ( ); De 5 a menos de 10 ( ); De 10 a menos de 15 años ( ); De 15 a menos
de 20 ( ); De 20 a menos de 25 ( )
4. Sé a quién recurrir para solicitar apoyo técnico en caso de errores
Muy de acuerdo De acuerdo Indeciso En desacuerdo Muy en desacuerdo
5. En la escala del 0 al 10, valora el servicio que se ofrece en el Servicio de Información:
Pésimo 0 1 2 3 4 5 6 7 8 9 10 Excelente
6. Detalle: ¿Qué es lo que más le gusta de nuestra empresa?
7. Haga una relación de 5 elementos que mejoraría o cambiaría.
8
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de
resultados, es decir, recoger la información de la muestra resumida en una tabla y realizar el
recuento de dichos datos. Las tablas son medios para presentar información de manera clara, con
el fin de que cualquier persona al verla sea capaz de entender los datos que ellas reflejan.
En una tabla pueden aparecer las siguientes partes (no de manera genérica):
También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables,
formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las
columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos
que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla.
No es necesario hacer el recuento de datos.
Ejemplo de tabla de contingencia. Esta tabla se ha elaborado con los datos: lanzamos dos
dados y sumamos los resultados. La columna de la izquierda representa las puntuaciones que
podrían salir en un dado, la fila de arriba las que podrían salir en otro. En este caso se
suman, así que en cada casilla se expresa esa suma. Por ejemplo, en la segunda casilla de la
segunda fila, en rojo, se muestra la suma del uno de su columna, más el uno de su fila.
LANZAMIENTO DE DADOS
PUNTUACIONES 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Ahora para averiguar la probabilidad de que al tirar ambos dados y sumar sus puntuaciones
salga un determinado número, contamos el número de veces que sale el número en la tabla
sobre todos los casos que hay. Por ejemplo , la probabilidad de que salga el 5 es de 4/36. El
cinco aparece 4 veces y hay 36 casos.
9
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
TABLAS DE FRECUENCIA
Una tabla de frecuencias es una herramienta estadística en la cual aparecen los datos ordenados
en columnas, se representan los valores obtenidos de la muestra y la frecuencia con la que estos
ocurren, es decir, la cantidad de veces que se repite cada uno.
Valores de la variable. Son las diferentes clases de variables que se analizan. Se representan
como xi.
Frecuencia absoluta. Es el número de veces que un dato aparece. Se representa como fi.
Frecuencia relativa. Es la división entre la frecuencia absoluta y el total de elementos. Se
representa como hi.
Frecuencia porcentual. La obtenemos multiplicando la frecuencia relativa por 100. Se
representa como %.
Frecuencia absoluta por valores de la variable (xifi)
xi fi hi %
Manzana 4 0,4 40
Pera 3 0,3 30
Plátano 2 0,2 20
Melocotón 1 0,1 10
Mandarina 1 0,1 10
TOTAL 10
10
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
1. Se hace una encuesta a un grupo de personas sobre el número de ordenadores que tienen
en casa. Se anotan sus resultados:
4 6 5 3 2 3 4 1 1 2 3 4 3 2 3 1 1 1 3 5 2
Elabora una tabla de frecuencias.
Solución:
xi fi xifi hi %
1 5 5 0,24 24
2 4 8 0,19 19
3 6 18 0,29 29
4 3 12 0,14 14
5 2 10 0,10 10
6 1 6 0,05 5
TOTAL 21 59
2. Lanzamos dos dados y anotamos la menor de las puntuaciones. Elabora una tabla de doble
entrada y anota la probabilidad de todos los casos.
Solución:
1 2 3 4 5 6
1 1 1 1 1 1 1
2 1 2 2 2 2 2
3 1 2 3 3 3 3
4 1 2 3 4 4 4
5 1 2 3 4 5 5
6 1 2 3 4 5 6
P (1) = 11/36
P (2) = 9/36
P (3) = 7/36
P (4) = 5/36
P (5) = 3/36
P (6) = 1/36
11
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Cuando se han recogido los datos correspondientes a una variable estadística, hay que tabularlos;
es decir, hay que confeccionar con ellos una tabla en la que aparezcan ordenadamente:
Los valores de la variable que se está estudiando.
El número de individuos de cada valor; es decir, su frecuencia.
La frecuencia absoluta es el número de veces que se presenta un valor al estudiar una variable.
Para hacer el recuento, se leen los datos uno a uno y se marca una señal en el correspondiente
valor. Si las señales se agrupan, de cinco en cinco por ejemplo, es más fácil contarlas. Se
representa por fi. La suma de frecuencias absolutas es igual al número total de datos, N.
Frecuencia Absoluta Acumulada: de un valor xi de la variable, es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por
Ni.
Ejemplo. Hemos obtenido una muestra de la altura de los 25 primeros visitantes a un parque de
atracciones. Sus medidas, en cm, son:
167 159 168 165 150 170 172 158 163 156
151 173 175 164 153 158 157 164 169 163
160 159 158 174 164
Elabora una tabla que represente estos resultados con sus frecuencias absolutas, relativas y
porcentajes. Toma intervalos de amplitud 5 cm comenzando por 150.
12
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda
hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.0516
31 8 24 0.258 0.774
32 III 3 27 0.097 0.871
33 III 3 30 0.097 0.968
34 I 1 31 0.032 1
31 1
0 10 10 8,3
1 20 30 25
2 41 71 59,2
3 29 100 83,3
4 14 114 95
5 5 119 99,2
6 1 120 100
Para calcular el % acumulado se multiplica cada número del Fi por 100 y se divide entre el
último número del Fi
13
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
1. Elabora una tabla como la del ejemplo con esta lista de alumnos y calificaciones:
Notas: 3 4 5 6 7 8 9 10
Nº alumnos: 2 14 6 3 5 2 3 1
Solución:
xi fi Fi % acumulado
3 2 2 5,6
4 14 16 44,4
5 6 22 61,1
6 3 25 69,4
7 5 30 83,3
8 2 32 88,9
9 3 35 97,2
10 1 36 100
2. En una muestra de 25 personas hemos preguntado las veces que han ido al cine en los dos
últimos meses, obteniendo estos resultados:
14, 14, 15, 13, 15, 14, 14, 14, 14, 15, 13, 14, 15, 16, 14, 15, 13, 14, 15, 13, 14, 14, 14, 15,
14
Haz una tabla donde aparezcan las frecuencias absolutas acumuladas y las frecuencias
relativas acumuladas.
Solución:
14
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Los datos que hemos obtenido de un estudio estadístico se pueden representar gráficamente
porque facilita su comprensión y la comprobación de las distintas opciones expuestas en el trabajo
con ellos. Los gráficos más utilizados son: el diagrama de barras, el histograma o pictogramas,
polígono de frecuencias y el diagrama de sectores.
DIAGRAMA DE BARRAS
Es una gráfica con barras de longitudes proporcionales al de los valores que representan.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas (horizontal) se sitúan los
valores de la variable, y sobre el eje de ordenadas (vertical) las frecuencias absolutas o relativas o
acumuladas.
Se puede mostrar el valor de la frecuencia sobre la barra. Los datos se representan
mediante barras de una altura proporcional a la frecuencia.
Grupo sanguíneo fi
A 80
B 65
AB 30
0 25
Total 200
15
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
POLÍGONOS DE FRECUENCIAS
Los polígonos de frecuencias se realizan trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Ejemplo. Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:
Hora Temperatura
5 7º
8 9°
13 11°
16 13°
19 10°
20 8°
23 6°
ci fi Fi
(50, 60) 55 10 10
(60, 70) 65 15 25
(70, 80) 75 13 38
(80, 90) 85 21 59
(90, 100) 95 19 78
(100, 110) 110 17 95
(110, 120) 115 3 98
DIAGRAMA DE SECTORES
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente
para las variables cualitativas.
Los datos son representados en un círculo dividido en sectores para cada variable. Para construirlo
se reparten los 360º del círculo de forma proporcional (el ángulo de cada sector es proporcional a
16
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJEMPLO
Representar un diagrama de sectores con los resultados de las últimas votaciones.
Elaboramos una tabla:
variables porcentaje
PP 27,05 %
PSOE 25,02 %
C’s 6,55 %
IU 4,72 %
Ahora dividimos el círculo en tantos sectores como variables tenga la tabla. Para averiguar el
porcentaje usamos la regla de tres:
PP:
100% 360º
27,05% X
17
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
xi fi
1 5
2 4
3 6
4 3
5 2
6 1
Solución:
xi fi
Manzana 4
Pera 3
Plátano 2
Melocotón 1
Mandarina 1
Solución:
18
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Ejemplo
En una muestra de 50 socios pertenecientes a un club deportivo, 11 juegan a baloncesto, 10 practican la
natación, 21 juegan al fútbol y el resto practican otro deporte. Realizar un diagrama circular con esta
información. Para obtener los sectores dividimos 360º entre el número de socios de la muestra (50) y lo
multiplicamos por los que intervienen en cada deporte, por ejemplo para baloncesto: 360/50 *11=
79,2º
Socios Ángulo
Baloncesto 11 79,2°
Natación 10 72°
Fútbol 21 151,2°
Otro deporte 8 57,6°
Total 50 360°
PICTOGRAMAS
Es otro método de representación de datos muy parecido al diagrama de barras, sólo que se utilizan
dibujos que hacen mención al valor objeto de estudio. Los gráficos pueden venir representados en dos o
tres dimensiones, pero empleando un dibujo a una determinada escala para expresar la unidad de
medida de los datos.
Los pictogramas son muy expresivos, pero poco precisos. Hay dos clases de pictogramas:
Se utiliza un dibujo que representa la variable estadística y ésta se repite tantas veces como haga
falta (frecuencia absoluta).
El dibujo utilizado varía de tamaño dependiendo de su frecuencia; a mayor frecuencia mayor es el
dibujo.
La siguiente tabla muestra la evolución de los capitales de un inversor desde el año 2009.
Año Población
2009 18.616.630
2010 21.388.551
2011 26.014.278
2012 30.582.936
2013 37.742.561
2014 40.499.791
2015 47.021.031
Este tipo de gráficos se utilizan en prensa, y sobre todo en infografías, ya que ofrecen la información de
manera más dinámica y atractiva.
19
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos. Para
tener una información clara y rápida de lo obtenido en el estudio se han creado los gráficos
estadísticos.
Hay muchos tipos de gráficas estadísticos. Cada uno de ellos es adecuado para un estudio
determinado, ya que no siempre se puede utilizar el mismo para todos los casos.
Los más comunes son:
Diagrama de barras
Histograma
Polígono de frecuencias o grafica lineal
Diagrama de sectores o grafica circular
Pictograma
Como ya sabemos, la estadística es aquella rama de la matemática que tiene por objeto
principalmente obtener y utilizar información acerca de objetos, fenómenos y situaciones del
entorno cotidiano, que pueden resultar interesantes para el investigador.
Los pasos a tener en cuenta son la recogida de datos y anotación de estos. Después la tabla de
frecuencias y gráfico que ayude a sacar conclusiones de forma rápida.
20
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
Por ejemplo: las 10.000 personas mayores de 65 años que viven en el distrito
Centro.
Variables cuantitativas: edad, número de hijos.
Variables cualitativas: nombre de las personas, lugar de nacimiento.
21
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Cuando realizamos un estudio estadístico, se obtiene un número muy significativo de datos, de los
cuales, es necesario identificar uno u otro por su mayor importancia. Los parámetros estadísticos o
medidas de centralización son una forma de resumir la información de una tabla de datos en un
único valor numérico.
Tratamos de obtener una serie de medidas numéricas que nos permitan, con objetividad y
precisión tener una visión más completa del fenómeno estudiado, resumir toda la información,
comparar distintas distribuciones, etc.
Medidas de centralización: Tienen como misión representar con un número a la serie estadística
bajo el punto de vista de su posición:
Media aritmética, moda (el valor que se presenta con más frecuencia) y mediana (el valor del
individuo que ocuparía el lugar central sí se colocaran ordenados de menor a mayor).
Medidas de dispersión: Sirven para medir el grado de alejamiento de los datos respecto de
una medida central: Rango o recorrido, desviación media, varianza, desviación típica,
coeficientes de Pearson...
Medidas de posición: Señalan la situación de algunos valores importantes de la distribución.
Para su obtención se usan los diagramas de cajas.
Cuartiles, deciles, centiles o percentiles.
MEDIA ARITMÉTICA
Definición. La media aritmética es el valor obtenido tras sumar todos los datos estadísticos y
dividir dicha suma por el número total de datos.
Ejemplo: Las notas de matemáticas de una clase de 40 alumnos han sido las siguientes:
1 7 9 2 5 4 4 3 7 8
4 5 6 7 6 4 3 1 5 9
2 6 4 6 5 2 2 8 3 6
4 5 2 4 3 5 6 5 2 4
22
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Ejercicio:
1. Seis amigos se han pesado obteniendo los siguientes resultados: 81, 93, 76, 68, 87 y 81 kg.
Hallar el peso medio.
Solución: 81+93+76+68+87+81/6=486/6= 81 kg.
2. En un test realizado a un grupo de 50 personas se han obtenido las puntuaciones que muestra la
tabla. Calcula la puntuación media.
xi fi xi · fi
(10,20) 15 3 45
(20,30) 25 9 225
(30,40) 35 8 280
(40,50) 45 10 450
(50,60) 55 8 440
(60,70) 65 4 260
(70,80) 75 8 600
50 2.300
Media: 2300/50=46
MODA
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos
puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Por ejemplo, si tenemos una tabla con las temperaturas diarias del mes de Enero en una ciudad y
queremos dar un valor aproximado de la temperatura ambiente durante este mes, podemos hacer lo
siguiente:
Temperatura Frecuencias
(Ti) (Fi)
10,5 6
11,5 8 Podemos tomar como valor representativo la
12,5 10 temperatura de 12,5ºC que es la que más se repite
13,5 5 a lo largo del mes. Por este motivo, a este valor se
le llama MODA.
14,5 4
15,5 9
16,5 8
17,5 3
23
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
MEDIANA
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de
individuos. Para calcular las medidas de posición es necesario que los datos estén ordenados
de menor a mayor.
Cálculo de la mediana:
RANGO
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la
distribución.
Definición. El rango o recorrido es la diferencia entre el valor mayor y el valor menor de una
distribución estadística. Se representa por R.
EJERCICIO
xi fi xifi
14 2 28
15 4 60
16 7 112
17 1 17
18 12 216
xi fi xifi
1 5 5
2 4 8
3 3 9
24
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
xi fi xifi
4 10 40
5 5 25
6 6 36
7 8 56
8 2 16
La práctica de la estadística es mucho más común que la de otras ramas de las matemáticas,
puesto que se usa con mucha frecuencia en cuestiones de tipo social y está involucrada en
cualquier actividad humana.
Además, la estadística sirve para llevar a cabo todo tipo de investigaciones científicas, ya que
permite, por ejemplo, establecer pautas sobre la evolución de enfermedades, el grado de eficacia
de un medicamento, etc.
Gracias a los gráficos estadísticos se puede analizar de forma rápida y concisa una gran
cantidad de información sobre la sociedad actual. Por ejemplo, la tasa de desempleo o de
mortalidad de un país.
Así, estas herramientas matemáticas nos permiten ofrecer una descripción y organización más
exacta de los datos, visual izar las relaciones entre los mismos, facilitar el cálculo de las medidas
de centralización, resumir los resultados de manera eficiente, significativa y cómoda y deducir
conclusiones generales.
Pero hay que tener cuidado a la hora de interpretar un gráfico estadístico. Para poder
comprender una gráfica, hay que saber en primer lugar cuál es el tema de estudio, y también se
ha de ser crítico, exigiendo calidad en los datos y que la muestra tomada sea la adecuada.
25
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
26
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
1. Los gastos mensuales de una familia vienen representados del siguiente modo: 35 %
en vivienda, 15 % en ropa, 25 % en alimentación, 20 % en colegios y el resto en
otros gastos. Realiza un diagrama de sectores.
2. Pedro celebra una fiesta en su casa a la que asisten 35 amigos. Se les pregunta su
edad y se anotan los siguientes datos: 13-15-12-16-12-15-12-16-12-12-13-13-15-
13-16-16-13-12-14-15-12-14-15-12-14-16-17-16-16-15-14-16-15-12-13.
Realiza un diagrama de sectores.
27
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Sin embargo, las experiencias aleatorias son experimentos cuyo resultado depende del azar, y las
usamos para estudiar el azar y sus propiedades o probabilidades.
En experimentos como los siguientes no es posible predecir el resultado con exactitud. En estas
situaciones nos encontramos ante experiencias aleatorias.
lanzar una moneda al aire para elegir cara o cruz y así decidir con que parte del campo me
quedo,
lanzar un dado,
una bola de una bolsa o de una urna donde hay bolas rojas, azules y negras.
28
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Importante. Los experimentos son cadenas de sucesos que pueden repetirse en las mismas
condiciones cuantas veces de desee. Es decir, son reproducibles (en las mismas condiciones) a
voluntad.
Para estudiar los fenómenos observables hay que modelizar. Modelizar un experimento es
construir un modelo matemático del mismo. Necesariamente, este modelo debe simplificar las
cosas y permitir la omisión de ciertos detalles. El éxito del modelo depende de si los detalles
omitidos tienen o no importancia en el fenómeno estudiado. Una de las formas de analizar la
validez de un modelo es deducir un cierto número de consecuencias del mismo y luego
contrastarlas con las observaciones del fenómeno.
Se llama modelo determinista aquel que asocia a un experimento una única cadena de sucesos
que conduce a un resultado final que es predecible con certeza (cuando conocemos con certeza el
resultado). Ejemplos: caída de una piedra, el lanzamiento de un misil, movimiento de un planeta.
Otra forma de abordar el problema es analizar los resultados posibles al lanzar una moneda y
luego asignar con algún criterio probabilidad de ocurrencia a dicha asignación. Un modelo
probabilístico (o estocástico) está representado en esta distribución de probabilidades entre los
resultados posibles. Un modelo del mismo tipo puede generarse para estudiar los resultados al
lanzar un dado. Como otros ejemplos, se puede considerar una situación meteorológica (cantidad
de lluvia que caerá en una tormenta y en un lugar específico), cantidad de bacterias en un litro de
leche, cantidad de glóbulos blancos en una muestra de sangre, cantidad de días lluviosos en el
año en curso, tiempo de duración de un ordenador portátil, peso que puede trasladar un
ascensor, etc.
29
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Todos los días utilizamos la probabilidad o el azar, con afirmaciones como: “no me toca nunca la
lotería”, o “posiblemente mañana haga frio”, o “seguro que me llaman”, etc.
En los casos anteriores nos referimos evidentemente a la probabilidad de que toque el número de
lotería que he comprado es bajo, o de que haya un cambio de temperatura a frio, es de
probabilidad alta o que me llamen después de una entrevista de trabajo es media por el número de
candidatos que nos presentamos.
Cuando hablamos de probabilidad nos referimos, sin duda, a realizar una estimación de la
frecuencia con la que pueda ocurrir un suceso.
Definición: Suceso elemental es cada uno de los posibles resultados que se pueden obtener en un
experimento aleatorio.
Cada uno de los RESULTADOS Rk que forman el espacio muestral se llama caso o punto muestral.
El ESPACIO MUESTRAL depende de los resultados en que nos fijemos.
30
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Ejemplo: En el experimento aleatorio de lanzar un dado de seis caras podemos contemplar los
siguientes sucesos o eventos:
S1= {Salir par} = {2, 4, 6}
S2= {Salir múltiplo de 3} = {3, 6}
S3= {Sacar más que 3} = {4, 5, 6}
Diremos que un suceso A se verifica (o se realiza) si al efectuar una prueba del experimento
aleatorio obtenemos como resultado uno de los puntos muestrales que VERIFICAN el suceso A.
Ejemplo. Sea el experimento consistente en lanzar una dado, con E={1,2,3,4,5,6} y sea el
suceso A={1,3,5} = “salir impar” Entonces diremos que A se verifica si al lanzar el dado sale 1,
3 ó 5, y diremos que no se verifica si sale 2, 4 ó 6.
Como vemos, todo suceso tiene asociado un subconjunto del espacio muestral E,
compuesto por todos los resultados que lo VERIFICAN.
TIPOS DE SUCESOS
Ejemplo: En una urna hay 15 bolas numeradas de 2 al 16. Extraemos una bola al azar y
observamos el número que tiene. Describe los sucesos:
A = "Obtener par" B = "Obtener impar"
C = "Obtener primo" D = "Obtener impar menor que 9"
escribiendo todos sus elementos.
Solución:
A = {2, 4, 6, 8, 10, 12, 14, 16}
B = {3, 5, 7, 9, 11, 13, 15}
C = {2, 3, 5, 7, 11, 13}
D = {3, 5, 7}
31
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
2. Una bolsa contiene ocho bolas numeradas con los números del 1 al 8. Extraemos una bola y
anotamos el número.
¿Cuál es el espacio muestral?
Escribe los sucesos:
A = obtener número primo
B = obtener múltiplo de 3
Solución:
Espacio muestral: E = (1, 2, 3, 4, 5, 6, 7, 8)
Sucesos:
Obtener número primo: A = (2, 3, 5, 7)
Obtener múltiplo de 3: B = (3, 6)
32
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Las probabilidades las vamos a denominar con P(). Así, en el suceso del lanzamiento de un dado
de seis caras numeradas del 1 al 6, ¿cuál es la probabilidad de sacar un 3? ¿Y de sacar un 4? En el
primer caso hablaríamos de P(3), o P(4), en ambos casos obtenemos el mismo resultado de
probabilidad, es decir 1/6, ya que existe la misma posibilidad de obtener un 3 o un 4 de entre los
6 resultados que se pueden obtener al lanzar un dado.
En nuestro ejemplo, todos los sucesos elementales tienen la misma probabilidad, con lo que se
afirmará que estos sucesos son equiprobables y se expresará como P(1) = P(2) = P(3) = P(4) =
P(5) = P(6) = 1/6. Asimismo, como del 1 al 6 hay tres números pares (2, 4 y 6), la probabilidad
de obtener un número par es P (par) = 3/6.
Para calcular la probabilidad de experiencias irregulares (un dado trucado, bolsas cuyo contenido
desconocemos…) el único modo que tenemos es experimentar. Cuanto más veces repitamos las
experiencias más nos acercaremos al valor exacto. Esto se conoce como la ley de los grandes
números. Si por ejemplo, repetimos la experiencia 100 veces lanzando el dado trucado, y el
número 6 sale 35 veces, dividimos 35 entre 100 y el resultado (0,35) será la probabilidad de seis.
Cuando son experiencias regulares (un dado normal, una baraja que esté completa…) usamos la
ley de Laplace:
Probabilidad de un sucesos =
33
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
EJERCICIOS
1. En una urna con 4 bolas blancas y 5 negras escribe la probabilidad de sacar bola blanca. ¿Y de
sacar bola negra?
Solución:
La probabilidad de sacar bola blanca: 4/9 y la probabilidad de sacar bola negra: 5/9
Definición. Simular un experimento aleatorio consiste en sustituirlo por otro más sencillo y capaz
de reproducir los mismos resultados.
Las calculadoras científicas disponen de la tecla RAND, RAN# ó RANDOM que al activarla, genera
un número al azar comprendido entre 0 y 1, llamado número aleatorio. Estos números resultan
de gran utilidad en la simulación de experimentos.
Ejercicio.
Dos personas eligen al azar, cada una de ellas, un número del 0 al 9. ¿Cuál es la probabilidad de
que las dos personas no piensen el mismo número?
34
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Resumen.
La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada
característica en una población, recogiendo los datos, organizándolos en tablas, representándolos
gráficamente y analizándolos para sacar conclusiones de dicha población.
Los conceptos básicos son:
• Población
• Individuo
• Muestra
• Variables. Pueden ser:
Cualitativas
Cuantitativas
Una tabla de valores es una tabla que relaciona dos magnitudes mediante la agrupación de datos.
A la hora de realizar un estudio estadístico hay que llevar a cabo los siguientes pasos:
• Seleccionar el método de investigación.
• Planificar la investigación.
• Realizar trabajo de campo.
• Confeccionar las tablas de estadísticas.
• Elaborar los resultados.
Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos
referentes a dos variables
Los datos se representan gráficamente porque eso facilita el trabajo con ellos. Dependiendo del tipo de
información que queremos representar usaremos distintos tipos de gráfico; el diagrama de barras o el
diagrama de sectores.
Las medidas de centralización son una forma de resumir la información de una tabla de datos, y son:
• La media.
• La moda.
• La mediana.
• El rango o recorrido.
35
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Las experiencias aleatorias son experimentos cuyo resultado depende del azar, y las usamos para
estudiar el azar y sus propiedades.
Caso.
Espacio muestral.
Sucesos.
Para calcular la probabilidad de experiencias irregulares el único modo que tenemos es experimentar.
GLOSARIO
• Dato estadístico es cada uno de los valores que se ha obtenido al realizar un estudio estadístico.
Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
• Diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo
discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los
valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o
acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia.
• Diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente
para las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de
cada sector es proporcional a la frecuencia absoluta correspondiente.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se
lee suma o sumatoria.
36
Aplicación del análisis de datos, la estadística y la probabilidad en la resolución de problemas
Mediana. Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados
de menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para
variables cuantitativas.
Población estadística es el conjunto de todos los elementos a los que se somete a un estudio
estadístico.
Parámetro estadístico es un número que se obtiene a partir de los datos de una distribución
estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o
por una gráfica. Hay tres tipos parámetros estadísticos:
o De centralización.
o De posición.
o De dispersión.
Polígonos de frecuencias se realizan trazando los puntos que
representan las frecuencias y uniéndolos mediante segmentos.
• Probabilidad de un suceso. Viene a ser la proporción o tanto por uno de veces que un suceso se
verifica de entre la totalidad de las veces que pudiera realizarse el experimento aleatorio.
• Resultado elemental. Todo resultado directo de efectuar una vez el experimento aleatorio objeto
de estudio.
• Suceso. Cualquier subconjunto del espacio muestral. El propio espacio muestral es un suceso.
• Suceso elemental. Conjunto formado por un único resultado elemental.
• Suceso seguro. El espacio muestral: E.
• Suceso imposible. Conjunto vacío, que no contiene ningún resultado elemental:
• Tablas de estadística. La distribución de frecuencias o tabla de frecuencias es una ordenación en
forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
WEBGRAFÍA
Eskola 2.0 - Recursos Educativos (Programa Escuela 2.0 de Euskadi)
La estadística
http://agrega.hezkuntza.net/ODE/es/es-eu_2011022013_1230517
Librosvivos.net
Estadística y probabilidad
http://www./ibrosvivos.netlsmtc/homeTC.asp?temaclave=1051
37