Manual - Probabilidad y Estadística - 3
Manual - Probabilidad y Estadística - 3
Actividades de Apertura
"Todas las oscuridades que presenta nuestra sociedad podrían ser iluminadas
por la Estadística". Günter Grass. Premio Nobel 1999
La estadística juega un papel fundamental en las sociedades actuales en las que se
producen y utilizan grandes cantidades de información, en este sentido, tiene que ver
con las formas en que se recogen, organizan y comunican conjuntos de datos y con
la manera en que éstos se analizan para hacer inferencias y predicciones para la toma
de decisiones.
La estadística extiende su radio de influencia a todas las disciplinas científicas y
sociales ya que como afirma Moore (2000) proporciona un método general útil para tratar datos, estimar
su variación y el riesgo en situaciones de azar, de modo que puede decirse que, es tan importante en
la cultura de las personas, que forma parte de un bagaje básico de alfabetización que todos debieran
tener.
La estadística es un método científico que encuentra aplicación en una gran diversidad de campos del
saber humano y cuya utilidad, como quedó demostrado desde el siglo pasado, va más allá de la mera
descripción, pues permite el descubrimiento de leyes y tendencias. Dentro de los muchos ejemplos que
permiten ilustrar esto, basta con citar el caso del estadístico alemán Ernesto Engel** (1821 – 1896) que
adquirió renombre en el terreno de las investigaciones económicas y sociales al descubrir la ley que
lleva su nombre y que se enuncia así: “Cuánto menor es el ingreso familiar, mayor es la proporción
destinada a la compra de alimentos”.
Con datos recabados en 1857, observó que esa proporción era de 62%, 55% y 50% en familias de
clase baja, media y alta, respectivamente. Al difundirse esta ley, resultó evidente que cuanto mayor es
la parte del ingreso familiar que se invierte en alimentos, menor es la que se puede destinar a otros
fines (vestido, salud, recreación, comodidades, etc.) y viceversa. Por esta razón, esta proporción ha
sido utilizada como unidad de medida del bienestar social.
No obstante, como todo instrumento, la estadística tiene sus limitaciones; no puede, por ejemplo,
diseñar investigaciones ni seleccionar problemas para someterlos a estudio, ni puede, por si sola,
aportar resultados valiosos o dar interpretaciones de resultados en ausencia de una sólida teoría. Por
otro lado, todos los resultados estadísticos, exactos o no, expresan de modo preciso mediante
números. Pero preciso no es sinónimo de exacto; son exactas las operaciones aritméticas, pero las
mediciones que conducen a los datos que las hacen posibles no siempre son confiables. Por esta razón
los resultados estadísticos deben ser siempre sometidos a crítica.
Pero ¿qué es la estadística? Desde mediados del siglo XVIII hasta una centuria después, la estadística
ha sido objeto de muchísimas definiciones”, sin embargo, será suficiente por ahora con que nos
familiaricemos con una definición que responde a los objetivos de este curso:
Mtro. Ozornio 2
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Actividades de Desarrollo
Definición de “Estadística”.
Estadística Descriptiva
Es un conjunto de procedimientos que sirven para organizar, describir y sintetizar datos, sin que las
conclusiones que se extraigan de éstos rebasen su ámbito específico.
Estadística Inferencial
Es un conjunto de procedimientos que se emplean para hacer inferencias y generalizaciones respecto
a una totalidad, partiendo del estudio de un número limitado de casos tomados de esta última.
Las inferencias y generalizaciones en esta rama, que complementa a la descriptiva, se basan en la
teoría de la probabilidad.
El carácter propio del método estadístico descansa en el estudio de grupos o masas, a través de los
elementos que los componen. En estadística no interesan aisladamente las características de un
Mtro. Ozornio 3
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
elemento de la masa. No interesa, por ejemplo, que la vida útil de una lámpara de cierto diseño sea de
10 mil horas y la de otra de 3 mil. Lo que importa es ver la tendencia de cierto número de lámparas que
puedan ser representativas de toda la producción; lo que se busca es descubrir, por ejemplo, que la
vida útil promedio de ese tipo de lámparas de 7 mil horas. Si lo que se estudia es un grupo de personas,
no interesa que una de ellas en particular profese el catolicismo y otra el protestantismo, por mencionar
algo; lo que quisiéramos conocer podrían ser los cultos existentes y el que más se profesa en el grupo.
El medio empleado para el estudio estadístico es la enumeración o recuento. Enumerar es captar las
características de los elementos sometidos a estudio y anotarlos o medirlos bajo las condiciones que
se presentan. La estadística es, básicamente, un método de inducción basado en los grandes números
y sus propiedades, con lo cual se eliminan los errores propios de la observación y se aumenta la validez
de los resultados obtenidos.
Actividades de cierre
Introducción
Mtro. Ozornio 6
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Actividades de Apertura
Actividades de Desarrollo
1.2.1 Población
La población o Universo es todo conjunto de personas, cosas, objetos, etc., con
ciertas características comunes que puede ser finita o infinita.
1.2.2 Muestra
La Muestra es toda porción de elementos tomada de una población, entre más grande
sea la muestra, será más representativa de la población.
El Muestreo es el procedimiento por el cual se recopila información de los elementos de una muestra,
existen varias formas de realizar el muestreo, unas son más sencillas que otras, otras más económicas
y otras más representativas.
Una Variable se puede representar con un símbolo tal como x, y, a, b, que puede tomar un valor
cualquiera. Si esta variable solamente toma un valor, se le llama Constante.
Alumno Promedio
Francisco 9.2
Felipe 8.7 Variable
Raúl 9.5
Jaime 8.0
Mtro Ozornio 7
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Aquí los números carecen de propiedades solo sirven para distinguir un estado civil
de otro, no significa que un estado civil sea mejor o mayor que otro.
Variables Ordinales clasifican las observaciones en categorías que exigen ordenación, su variable
operacional es una escala ordinal de mayor a menor.
Mtro Ozornio 8
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Ejemplo
Una variable continua toma valores a lo largo de un continuo, esto es, en todo un
intervalo de valores. Un atributo esencial de una variable continua es que, a diferencia
de una variable discreta, nunca puede ser medida con exactitud; el valor observado depende en gran
medida de la precisión de los instrumentos de medición. Con una variable continua hay inevitablemente
un error de medida.
La siguiente gráfica resume los dos tipos de variables:
Cualitativa
Tipos de o categórica
Discreta
variables
Cuantitativa
o numérica
Continua
1. Señala con una palomita el tipo de escalas de medida a la que pertenece cada una de las variables
siguientes:
No. Variables Nominal Ordinal De intervalo Continuas
Discretas De razón
1 Peso de una persona
2 La raza de un perro
3 Frecuencia cardiaca
4 Grado de una enfermedad
5 Marca de un automóvil
6 La escolaridad de una persona
7 Nacionalidad
8 Cantidad de Hemoglobina
9 Lugar de nacimiento
10 Número de hijos
Mtro Ozornio 9
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Actividades de cierre
1. En tu cuaderno, elabora un mapa conceptual de los tipos de variables y las categorías de los datos.
En la elaboración de tu mapa incluye algunos ejemplos.
Mtro Ozornio 10
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
1.4 Frecuencias
Introducción
Actividades de Apertura
Representa la cantidad de veces que se repite una observación, expresada como proporción de la
muestra, es decir, es el resultado de dividir el valor de la frecuencia absoluta por el tamaño de la muestra
estadística.
Esta se representa con fr .y se define como f = n/N, siendo n el número de veces que se repite la
respuesta y N el tamaño de la muestra. Su valor se expresa como porcentaje.
Frecuencia relativa acumulada
En esta se tiene en cuenta la sumatoria de todas las frecuencias relativas inferiores o iguales al valor
en cuestión. Se representa con fr.
La frecuencia relativa acumulada de la clase 𝒊 es igual a la suma de las frecuencias relativas de todas
las clases anteriores a ella más la de la clase 𝒊.i
Mtro Ozornio 11
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Actividades de Desarrollo
1. Analiza los siguientes ejemplos desarrollados, ya que esto te permitirá poder utilizar esta información
más adelante en tablas más complejas para encontrar las medidas de tendencia central o de dispersión.
Ejemplo 1.
Más adelante observarás la explicación para ordenar los datos, en este espacio te explicaré como
retomar las frecuencias y colocarlas en la siguiente tabla.
Al ordenar los datos en esta tabla puedo empezar a retomar los datos que se repiten a esto le
llamaremos frecuencias
Tabla 1. Velocidad de automóviles en una autopista.
Frecuencia Frecuencia
Peso en libras Frecuencia absoluta Relativa
Clase Acumulada
𝒇𝒊 = 𝒇
𝒇𝒓 𝒄𝒇
1 87 - 95 8 0.16 8
2 96 - 104 3 0.06 11
3 105 - 113 13 0.26 24
4 114 - 122 4 0.08 28
5 123 - 131 3 0.06 31
6 132 - 140 10 0.2 41
7 141 - 149 8 0.16 49
8 150 - 158 1 0.02 50
N=n=∑ 𝒇 =50 1
Observa que la suma de la frecuencia relativa siempre será la unidad, en el caso de la frecuencia
acumulada no se suma ya que esta acumulada dando el total de las frecuencias.
Mtro Ozornio 12
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Actividades de cierre
En este caso se está agregando una columna para que agregues la frecuencia relativa acumulada.
Vida de una pieza metálica.
1. Una máquina para triturar piedra utiliza una pieza metálica sujeta a rotación y fricción. Esa pieza
tiene lo que se llama un “tiempo” de vida útil”. El productor de las máquinas realiza frecuentemente
pruebas a la pieza para conocer cuántas horas de duración de la pieza debe garantizarles a los
clientes. En la siguiente tabla se muestran los resultados de la distribución de frecuencias de los
tiempos de vida obtenidos en las 60 piezas.
1 2900 - 3100 5
2 3101 - 3301 8
3 3302 - 3502 12
4 3503 - 3703 25
5 3704 - 3904 10
Total
1. Analiza los siguientes ejercicios como reforzamiento del tema analizado anteriormente Frecuencias
absoluta y relativa, frecuencia acumulada y completa las tablas.
Mtro Ozornio 13
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
1 5< T ≤10 23
2 10 <T ≤15 66
3 15< T ≤20 49
4 20< T ≤25 16
5 25< T ≤30 4
6 30< T ≤35 2
Totales 160
Mtro Ozornio 14
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
b) Se realiza una investigación acerca del punto de fusión del plomo (Temperatura a la cual cambia
de sólido a líquido). Se trabaja en un laboratorio con temperatura controlada a 26𝑜𝐶 en crisoles
de acero (Fuente de fuego de precisión e instrumentos de medición de calidad), Los datos de
una muestra de 100 observaciones se han vaciado en la tabla de distribución de frecuencias
siguiente:
Intervalo
Frecuencia Frecuencia Frecuencia
:Temperatura de Frecuencia
Clase Relativa Acumulada Relativa
fusión en 𝒇
𝒇𝒓 𝒄𝒇 Acumulada
º𝑪
1 326< C ≤326.4 8
2 326.4< C ≤326.8 12
3 326.8< C ≤327.2 70
4 327.2< C ≤327.6 7
5 327.6< C ≤328 3
Totales n=
Mtro Ozornio 15
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES
Mtro Ozornio 16
Probabilidad y Estadística: Aprendizajes Esenciales
2.1 Media
Introducción
Media
Es el promedio más utilizado y por lo general se denomina media. La media aritmética o media de un
conjunto de elementos se define como la suma de los valores de estos elementos dividido entre el
número total de ellos. Se simboliza 𝑋̅ (léase 𝑋̅ barra), para datos no agrupados, matemáticamente se
determina por la ecuación:
∑ 𝑿𝒊 𝑿𝟏 + 𝑿𝟐 + 𝑿𝟑 + ⋯ + 𝑿𝑵
̅=
𝑿 =
𝑵 𝑵
Donde:
𝑋̅= Media aritmética o media.
𝑋= Valor de cada elemento.
𝑁= Número total de elementos.
Ejemplo:
Determina la media aritmética de los números 18, 13, 15, 22 y 20.
18 + 13 + 15 + 22 + 20 88
𝑋̅ = = = 𝟏𝟕. 𝟔
5 5
Cuando los datos se presentan agrupados mediante una distribución de frecuencias, todos los
valores caen dentro de los intervalos de clase dados que se consideran coincidentes con las marcas
de clase o puntos medios de cada intervalo, es decir, las ponderaciones son las frecuencias y las
marcas de clase o puntos medios son los valores que se ponderan.
En una distribución de frecuencias para datos agrupados, la media aritmética se determina al
multiplicar las distintas marcas o puntos medios de clase por sus respectivas frecuencias de clase; se
suman los productos y el resultado se divide entre el número total de frecuencias. Matemáticamente se
representa:
∑𝒇 𝑿
̅=
𝑿
𝑵
Donde:
Ejemplo:
∑𝑓 𝑋 3 616
𝑋̅ = = = 37.666
𝑁 96
2.2.1 Mediana
Se define como el valor medio a aquel que divide a un conjunto de datos que se
ordena de acuerdo con su magnitud (de forma ascendente o de forma descendente)
en dos partes iguales, es decir, es aquel valor central que deja por debajo igual
número de elementos que por arriba de él.
Ejemplos:
1. Determina la mediana de los números 25, 29, 24, 29, 27, 25, 29, 31, 26
Solución:
Al ordenar ascendentemente el conjunto de elementos numéricos dado tenemos:
Por definición, la mediana de los números es el valor central, en este caso es 27.
2. Determina la mediana de los números 49, 38, 46, 40, 36, 42, 36, 43
Solución:
Al ordenar descendentemente el conjunto de elementos numéricos dado se tiene:
42 + 40
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 41
2
𝐿𝑅1 = Límite real inferior de la clase mediana, es decir, la clase que contiene el valor de la
mediana.
𝑁= Número total de datos, es decir, la frecuencia total.
∑ 𝑓1 = Suma de las frecuencias de todas las clases por debajo de la clase mediana.
𝑁
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎= Frecuencia de la clase mediana, la cual nunca debe ser mayor que 2
𝐶= El tamaño del intervalo de la clase mediana.
Ejemplo:
La siguiente tabla de distribución de frecuencias muestra las puntuaciones que obtuvieron durante el
primer parcial 56 estudiantes en un examen de geometría analítica. Calcula la mediana.
Solución:
𝑁 56
Se localiza la clase mediana: 2
= 2
= 28
73 + 72
𝐿𝑅1 = = 72.5
2
𝑁 = 56
∑ 𝑓1 = 23
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 15
𝐶=7
DGETI Academia Nacional de Matemáticas 63
Probabilidad y Estadística: Aprendizajes Esenciales
𝑁 56
− ∑ 𝑓1 − 23
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝐿𝑅1 + [ 2 ] 𝐶 = 72.5 + [ 2 ] (7)
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 15
28 − 23 5
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 72.5 + [ ] (7) = 72.5 + ( ) (7)
15 15
2.2.2 Moda
Entre las características de la moda destacan que ésta puede no existir, incluso si
existe puede no ser única. Si un conjunto de valores dado presenta una sola moda
se denomina unimodal. Sí presenta dos modas se denomina bimodal; si
presentan más de dos modas se denomina multimodal.
Ejemplos 1: Dado el siguiente conjunto de números 4, 6, 8, 10, 12, 14, 16, 18, 20; determina su moda.
Solución: Analizando el conjunto de números dados, se observa que todos ellos tienen igual
frecuencia, por lo que se concluye que no presenta moda, es decir, no existe.
Ejemplos 2: Dado el siguiente conjunto de números 3, 3, 4, 6, 8, 8, 8, 11, 11, 13, 15; determina su
moda.
Solución: Analizar el conjunto de números dado, se observa que el número que se presenta con
mayor frecuencia es el 8, por lo que se concluye que el valor de la moda es 8 y el conjunto se denomina
unimodal.
Ejemplos 3: Dado el siguiente conjunto de números 10, 12, 12, 12, 13, 14, 14, 14, 15, 15, 16, 17, 17,
17, 19; determina su moda.
Solución: Al analizar el conjunto de números dado, se observa que los números que se presentan
con mayor frecuencia son el 12, 14 y 17, por lo que se concluye que los valores de la moda son 12,
14 y 17, en donde el conjunto se denomina multimodal.
∆𝟏
𝑴𝒐𝒅𝒂 = 𝑳𝑹𝟏 + ( )𝑪
∆𝟏 + ∆𝟐
Donde:
𝐿𝑅1 = Límite real inferior de la clase modal, es decir, la clase que contiene el valor de la moda.
Ejemplo 1:
La siguiente tabla de distribución de frecuencias agrupa los salarios semanales en miles de pesos de
130 empleados técnicos de la empresa TRW, división de cinturones de seguridad; determina la moda
de dichos salarios.
Solución: Primero, se considera la tabla de distribución de frecuencias para localizar la clase modal
que se caracteriza por tener la máxima frecuencia y el valor de la moda que resulta ser (750 – 773).
Intervalos Frecuencias
(salarios) (empleados)
654 - 677 3
678 - 701 7
702 - 725 13
726 - 749 19 ∆1 = 26 − 19 = 7
Clase modal 750 - 773 26
774 - 797 21 ∆2 = 26 − 21 = 5
798 - 821 17
822 - 845 12
846 - 869 8
870 - 893 4
N= 130
𝐿𝑅1 = El límite real inferior de la clase modal se obtiene sumando el límite superior de un intervalo de
clase y el límite inferior de intervalo de clase contiguo superior y dividido entre dos, es decir:
749 + 750
𝐿𝑅1 = 749.5
2
𝐿𝑅1 = 749.5
∆1 = 26 − 19 = 7
∆2 = 26 − 21 = 5
𝐶 = 23
∆𝟏 𝟕
𝑴𝒐𝒅𝒂 = 𝑳𝑹𝟏 + ( ) 𝑪 = 𝟕𝟒𝟗. 𝟓 + ( ) (𝟐𝟑)
∆𝟏 + ∆𝟐 𝟕+𝟓
La moda de los salarios calculada a partir de datos agrupados es 762. 92 miles de pesos.
Actividades de Apertura
∑𝑓 𝑋
𝑋̅ = =
𝑁
Actividades de Desarrollo
Intervalos Frecuencias
(horas) (familias)
30 - 39 4
40 - 49 9
50 - 59 13
60 - 69 19
70 - 79 12
80 - 89 3
𝑁= 60
Actividades de cierre
1. Realiza la siguiente actividad en una hoja de cálculo Excel para determinar lo que se te solicita:
La siguiente tabla de Distribución de frecuencias registra el número de horas al mes que 180 miembros
de un club altruista dedican a labores sociales en su comunidad.
Determinar:
a) La media aritmética
b) La mediana
c) La moda
d) Construye el Histograma
Frecuencias Marca de
Intervalos
(miembros) clase fX
(horas)
f X
10 - 14 6
15 - 19 14
20 - 24 23
25 - 29 28
30 - 34 19
35 - 39 11
40 - 44 7
Solución: N= 108 ∑𝑓 𝑋 =
Ejercicios Adicionales
c) Doce vendedores de autos usados vendieron en una semana, respectivamente, 59, 72, 86, 45,
64, 48, 69, 90, 43, 95, 64 y 81 automóviles. Determina:
i) La media aritmética.
ii) La mediana.
iii) La moda e indica el tipo de moda que resulta.
FRECUENCIA MARCA DE
INTERVALO fX
f CLASE X
30 - 39 7
40 - 49 12
50 - 59 19
60 - 69 16
70 - 79 10
80 - 89 6
90 - 99 2
N = 72 ∑𝑓 𝑋 =
MARCA DE
INTERVALO FRECUENCIA
CLASE fX
(estaturas) f
X
152 - 156 25
157 - 161 18
162 - 166 36
167 - 171 55
172 - 176 53
177 - 181 15
N = 202
Soluciones:
i) 𝑋̅ = 𝑑𝑒 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎
ii) 𝑀𝑒 = 𝑑𝑒 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎
iii) 𝑀𝑜 = 𝑑𝑒 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎
Introducción
2.3.1. Cuartiles
Se definen como los intervalos dentro de los cuales quedan proporcionalmente repartidos los datos sin
agrupar o agrupados en una distribución formada por 4 partes iguales.
Se tienen 3 cuartiles que se simbolizan por 𝑄1 (primer cuartil), 𝑄2 (segundo cuartil) y 𝑄3 (tercer cuartil),
en donde cada uno contendrá el mismo número de datos, es decir, el 25% del total.
𝑲𝑵
Para determinar el valor de los cuartiles en datos no agrupados, aplicamos la expresión general 𝟒
y las siguientes reglas:
a) Si KN es divisible exactamente 4, el valor del cuartil buscado será la media aritmética entre el
𝑲𝑵
dato ordenado cuya posición se obtiene de 𝟒
y el siguiente dato de orden.
b) Si KN no es divisible exactamente entre 4, el valor del cuartil buscado será el dato ordenado
𝐾𝑁
cuya posición si obtiene de redondear al entero más próximo el resultado de 4
.
𝐾= K-enésimo cuartil = Se refiere al primero, segundo y tercer cuartil, según sea el que se tenga
que determinar.
𝐿𝑅1 = Límite real inferior de la clase K-enésimo cuartil.
𝑁= Número total de datos, es decir, la frecuencia total.
∑ 𝑓= Suma de las frecuencias de todas las clases por debajo de la clase de K-enésimo cuartil.
𝐾𝑁
𝑓𝑘 = Frecuencia de la clase del K-enésimo cuartil, la cual nunca debe ser mayor que 4
𝐶= Tamaño del intervalo de la clase del K-enésimo cuartil.
2.3.2 Deciles
𝑲𝑵
− ∑𝒇
𝑫𝑲 = 𝑳𝑹𝟏 + [ 𝟏𝟎 ]𝑪
𝒇𝒌
Donde:
𝐾= K-enésimo decil = Se refiere al primero, segundo, tercero,…, noveno decil, según sea el que
se tenga que determinar.
𝐿𝑅1 = Límite real inferior de la clase K-enésimo decil.
𝑁= Número total de datos, es decir, la frecuencia total.
∑ 𝑓= Suma de las frecuencias de todas las clases por debajo de la clase de K-enésimo decil.
𝐾𝑁
𝑓𝑘 = Frecuencia de la clase del K-enésimo decil, la cual nunca debe ser mayor que
10
𝐶= Tamaño del intervalo de la clase del K-enésimo decil.
2.3.3 Percentiles
𝑲𝑵
𝟏𝟎𝟎 − ∑𝒇
𝑷𝑲 = 𝑳𝑹𝟏 + [ ]𝑪
𝒇𝒌
Donde:
76, 77, 81, 82, 83, 88, 92, 95, 99, 102, 105, 107, 108, 110, 112, 116, 119, 123, 125, 128, 131, 135, 137,
140, 142, 146, 149, 152, 155, 158, 161, 164, 166, 168, 171.
Determina el 𝑄3 , 𝐷6 y 𝑃70 .
Solución:
𝐾𝑁 3(35)
a) 𝑄3 = 4
= 4
= 26.25 ≈ 26 redondeado al entero más próximo.
𝐾𝑁 6(35)
b) 𝐷6 = = = 21 el valor del 𝐷6 será la media aritmética entre el 21° dato ordenado y el
10 10
siguiente del conjunto, es decir,
131+135
𝐷6 = 2
= 133 El valor del 𝐷6 es 133.
𝐾𝑁 70(35)
c) 𝑃70 = 100 = 100
= 24.5 ≈ 25 redondeado al entero más próximo.
La siguiente tabla de distribución de frecuencias registran los pesos en libras de 42 atletas mexicanos
que participaron en los XXIX Juegos Olímpicos en Beijing en 2008.
𝐾𝑁 9(42) 𝐾𝑁 37.8 − 35
= = 37.8 − ∑𝑓 𝐷9 = 144.5 + [ ] (7)
10 10 𝐷9 = 𝐿𝑅1 + [ 10 ]𝐶 6
𝑓𝑘
c) Para determinar el sexagésimo quinto percentil 𝑃65 , usamos los siguientes datos:
𝐾𝑁
𝐾𝑁 65(42) − ∑𝑓
= = 27.3 𝑃65 = 𝐿𝑅1 + [ 100 ]𝐶 27.3 − 22
100 100 𝑓𝑘 𝑃65 = 137.5 + [ ] (7)
13
137 + 138
𝐿𝑅1 = = 137.5
2
∑ 𝑓 = 2 + 4 + 7 + 9 = 22
𝑓𝑘 = 13
𝐶=7 El valor del sexagésimo quinto percentil es 140.35 libras,
es decir, 65% de los atletas pesa 143.75 libras o menos.
Actividades de Apertura
1. La siguiente tabla de distribución de frecuencias Registra los tiempos en segundos que 35 atletas
varones tardan en recorrer los 100 metros planos. Determina:
a) Los cuartiles: 𝑄1 y 𝑄2 ;
b) Los deciles: 𝐷3, 𝐷6 y 𝐷9
c) Los percentiles 𝑃35 , 𝑃50 , 𝑃65 y 𝑃80 .
Intervalos Frecuencias
(segundos) (atletas)
8.8 - 9.2 2
9.3 - 9.7 5
9.8 - 10.2 13
10.3 - 10.7 9
10.8 - 11.2 6
𝑁= 35
Introducción
Hasta este momento se han abordado los cálculos de diferentes medidas que nos
describen un comportamiento general, su distribución y sus tendencias de una variable.
Las medidas de correlación permiten relacionar diversas variables y determinar si
tienen o no dependencia alguna entre ellas.
Actividades de Apertura
Actividades de Desarrollo
Tomemos los siguientes datos de 10 alumnos para ver la relación de sus materias:
Si observas los puntos del gráfico anterior, ¿qué tendencia muestra el conjunto?
Para conocer o dar una respuesta certeza a la pregunta del inciso b) calculemos el coeficiente de
correlación “r”
DGETI Academia Nacional de Matemáticas 99
Probabilidad y Estadística: Aprendizajes Esenciales
x y
Cálculo Física
1568.4 1568.4
𝑟= = = 𝟎. 𝟖𝟏𝟑𝟑
√1701.6√2185.6 (41.2504545)(46.7504011)
Como podemos observar “r” tiene un valor positivo, quiere decir que las variables tienen una
dependencia positiva, es decir que si en entra más alta calificación tenga en matemáticas también
subirá la de física. Estos alumnos si son uno buenos candidatos al área de Físico-matemáticas.
CORRELACIÓN
100
80
60
40
20
0
0 20 40 60 80 100
También puedes realizar el ejercicio usando una hoja de Excel, para ello:
https://www.youtube.com/watch?v=cRv_Ff315J4&t=15s
Actividades de cierre
Realiza el siguiente ejercicio para ver si existe relación entre las materias de Cálculo Diferencial e
inglés.
Ejercicios Adicionales
Ejercicio 1: Se midió el peso de 12 personas (x), y la extensión de su cintura (y). Se obtuvieron los
siguientes datos.
x Peso y Cintura
80 100 80 100 8000 6400 10000
75 90
90 100
95 110
70 90
65 95
85 120
83 120
78 115
68 90
73 99
92 105
Sumas Sumas
Media
𝑟= = =
Gráfica
Calcula el coeficiente de correlación o relación que existen entré el peso y la medida de la cintura.
Argumentación: ___________________________________________________________________
________________________________________________________________________________
Ejercicio 2: Se registraron en la tabla siguiente la edad (en años) y la conducta agresiva (medida en
una escala de cero a 10) de 10 niños.
𝑟= = =
Gráfica
Argumentación: ____________________________________________________________________
_________________________________________________________________________________
Introducción
Actividades de Apertura
Actividades de Desarrollo
y= bx+a+ €
Donde:
b= Es la pendiente de la recta, este valor debe estimarse a partir de la tendencia de los puntos
a= Es la ordenada al origen, es decir, el punto en que la recta cruza el eje Y
y= Es la variable dependiente
x= Es la variable independiente
€ es el error
𝑪𝑶𝑽𝒙𝒚
𝒃= donde Sx es la Varianza de x
𝑺𝒙
̅ − 𝒃𝒙
𝒂=𝒚 ̅ ̅ es la media de la variable y, 𝒙
donde 𝒚 ̅ es la media de la variable x
x y
Cálculo Física
48 56 -15.8 -15.2 240.16 249.64 231.04
53 64 -10.8 -7.2 77.76 116.64 51.84
77 82 13.2 10.8 142.56 174.24 116.64
44 67 -19.8 -4.2 83.16 392.04 17.64
69 85 5.2 13.8 71.76 27.04 190.44
79 86 15.2 14.8 224.96 231.04 219.04
84 93 20.2 21.8 440.36 408.04 475.24
68 76 4.2 4.8 20.16 17.64 23.04
61 58 -2.8 -13.2 36.96 7.84 174.24
55 45 -8.8 -26.2 230.56 77.44 686.44
638 712 Sumas 1568.4 1701.6 2185.6
63.8 71.2
1568.4
𝐶𝑂𝑉𝑋𝑌 = = 174.266667
9
1701.6
𝑆𝑋 = = 189.066667
9
174.267
𝑏= = 092172073
189.067
𝑎 = 71.2 − (0.9217207)(63.8) = 12.394217
Actividades de cierre
Cálculo
Alumno Inglés
Diferencial
Alumno 1 44 100
Alumno 2 53 94
Alumno 3 66 90
Alumno 4 69 83
Alumno 5 73 80
Alumno 6 79 78
Alumno 7 81 74
Alumno 8 84 70
Alumno 9 89 68
Alumno 10 95 63
Ejercicios Adicionales
Ejercicio 1
𝐶𝑂𝑉𝑋𝑌 =
𝑆𝑋 =
𝑏=
𝑎=
𝒚=
Ejercicio 2
Define la recta de Regresión Lineal que se aproxima a la relación entre la edad y la conducta
de los niños.