0% encontró este documento útil (0 votos)
28 vistas44 páginas

Manual - Probabilidad y Estadística - 3

Cargado por

daniel vera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
28 vistas44 páginas

Manual - Probabilidad y Estadística - 3

Cargado por

daniel vera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 44

PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Bloque 1 | INTRODUCCIÓN A LA ESTADÍSTICA


1.1 Definición de Estadística
1.1.1 Campo de estudio.

Actividades de Apertura

"Todas las oscuridades que presenta nuestra sociedad podrían ser iluminadas
por la Estadística". Günter Grass. Premio Nobel 1999
La estadística juega un papel fundamental en las sociedades actuales en las que se
producen y utilizan grandes cantidades de información, en este sentido, tiene que ver
con las formas en que se recogen, organizan y comunican conjuntos de datos y con
la manera en que éstos se analizan para hacer inferencias y predicciones para la toma
de decisiones.
La estadística extiende su radio de influencia a todas las disciplinas científicas y
sociales ya que como afirma Moore (2000) proporciona un método general útil para tratar datos, estimar
su variación y el riesgo en situaciones de azar, de modo que puede decirse que, es tan importante en
la cultura de las personas, que forma parte de un bagaje básico de alfabetización que todos debieran
tener.
La estadística es un método científico que encuentra aplicación en una gran diversidad de campos del
saber humano y cuya utilidad, como quedó demostrado desde el siglo pasado, va más allá de la mera
descripción, pues permite el descubrimiento de leyes y tendencias. Dentro de los muchos ejemplos que
permiten ilustrar esto, basta con citar el caso del estadístico alemán Ernesto Engel** (1821 – 1896) que
adquirió renombre en el terreno de las investigaciones económicas y sociales al descubrir la ley que
lleva su nombre y que se enuncia así: “Cuánto menor es el ingreso familiar, mayor es la proporción
destinada a la compra de alimentos”.
Con datos recabados en 1857, observó que esa proporción era de 62%, 55% y 50% en familias de
clase baja, media y alta, respectivamente. Al difundirse esta ley, resultó evidente que cuanto mayor es
la parte del ingreso familiar que se invierte en alimentos, menor es la que se puede destinar a otros
fines (vestido, salud, recreación, comodidades, etc.) y viceversa. Por esta razón, esta proporción ha
sido utilizada como unidad de medida del bienestar social.
No obstante, como todo instrumento, la estadística tiene sus limitaciones; no puede, por ejemplo,
diseñar investigaciones ni seleccionar problemas para someterlos a estudio, ni puede, por si sola,
aportar resultados valiosos o dar interpretaciones de resultados en ausencia de una sólida teoría. Por
otro lado, todos los resultados estadísticos, exactos o no, expresan de modo preciso mediante
números. Pero preciso no es sinónimo de exacto; son exactas las operaciones aritméticas, pero las
mediciones que conducen a los datos que las hacen posibles no siempre son confiables. Por esta razón
los resultados estadísticos deben ser siempre sometidos a crítica.
Pero ¿qué es la estadística? Desde mediados del siglo XVIII hasta una centuria después, la estadística
ha sido objeto de muchísimas definiciones”, sin embargo, será suficiente por ahora con que nos
familiaricemos con una definición que responde a los objetivos de este curso:

Mtro. Ozornio 2
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Actividades de Desarrollo

Definición de “Estadística”.

Ve al siguiente sitio https://www.ecured.cu/Estad%C3%ADstica y a partir del


mismo responde en una cuartilla a las siguientes preguntas:
¿Qué es la estadística?
¿Qué campos conforman la estadística?
¿Qué métodos utiliza y en qué consisten?
¿Con qué disciplinas se relaciona?
Una vez que hayas terminado de dar respuesta a las preguntas, comparte comentarios al respecto de
las preguntas con al menos un compañero y hagan llegar su trabajo a su profesor(a)
Habrás observado que se puede entender la estadística como la ciencia que permite responder a
ciertas preguntas basándose en datos empíricos, es decir, en datos que se originan de la observación
o la experiencia Entendida así, diremos que es la ciencia que tiene que ver con los métodos que dan
respuesta a determinadas cuestiones, mediante la recolección y la interpretación apropiadas de datos
empíricos. Las observaciones o las experiencias que constituyen los datos pueden resultar de la
investigación científica, de la actividad comercial o de la vida cotidiana. En cualquier caso, la estadística
busca dar sentido a los datos; esto implica tanto la recolección como la interpretación de éstos.
La recolección abarca el diseño de las investigaciones empíricas la planeación de lo que se quiere
observar, la calidad y suficiencia de la observación y el registro de los datos; la interpretación, el análisis
y el resumen de los datos, la extracción de conclusiones a partir de ellos y el reporte y la presentación
de los resultados.
De igual modo, habrá observado que, para su estudio, la estadística se divide en dos grandes ramas;
descriptiva e inferencial.

Estadística Descriptiva
Es un conjunto de procedimientos que sirven para organizar, describir y sintetizar datos, sin que las
conclusiones que se extraigan de éstos rebasen su ámbito específico.

Estadística Inferencial
Es un conjunto de procedimientos que se emplean para hacer inferencias y generalizaciones respecto
a una totalidad, partiendo del estudio de un número limitado de casos tomados de esta última.
Las inferencias y generalizaciones en esta rama, que complementa a la descriptiva, se basan en la
teoría de la probabilidad.
El carácter propio del método estadístico descansa en el estudio de grupos o masas, a través de los
elementos que los componen. En estadística no interesan aisladamente las características de un

Mtro. Ozornio 3
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

elemento de la masa. No interesa, por ejemplo, que la vida útil de una lámpara de cierto diseño sea de
10 mil horas y la de otra de 3 mil. Lo que importa es ver la tendencia de cierto número de lámparas que
puedan ser representativas de toda la producción; lo que se busca es descubrir, por ejemplo, que la
vida útil promedio de ese tipo de lámparas de 7 mil horas. Si lo que se estudia es un grupo de personas,
no interesa que una de ellas en particular profese el catolicismo y otra el protestantismo, por mencionar
algo; lo que quisiéramos conocer podrían ser los cultos existentes y el que más se profesa en el grupo.
El medio empleado para el estudio estadístico es la enumeración o recuento. Enumerar es captar las
características de los elementos sometidos a estudio y anotarlos o medirlos bajo las condiciones que
se presentan. La estadística es, básicamente, un método de inducción basado en los grandes números
y sus propiedades, con lo cual se eliminan los errores propios de la observación y se aumenta la validez
de los resultados obtenidos.

1.1.2 Antecedentes históricos.


La palabra estadística se origina, en las técnicas de recolección, organización, conservación, y
tratamiento de los datos propios de un estado, con que los antiguos gobernantes controlaban sus
súbditos y dominios económicos. Estas técnicas evolucionaron a la par con el desarrollo de las
matemáticas, utilizando sus herramientas en el proceso del análisis e interpretación de la información.
A modo de una brevísima nota histórica se menciona que; Para mediados del siglo XVII en Europa, los
juegos de azar eran frecuentes, aunque sin mayores restricciones legales. El febril jugador De Meré
consultó al famoso matemático y filósofo Blaise Pascal (1623-1662) para que le revelara las leyes que
controlan el juego de los dados, el cual, interesado en el tema, sostuvo una correspondencia epistolar
con el tímido Pierre de Fermat (1601-1665, funcionario público apasionado por las matemáticas; célebre
porque no publicaba sus hallazgos) dando origen a la teoría de la probabilidad, la cual se ha venido
desarrollando y constituyéndose en la base primordial de la estadística inferencial.
Hoy en día, son de uso cotidiano las diferentes técnicas estadísticas que partiendo de observaciones
muéstrales o históricas, crean modelos lógico-matemáticos que se "aventuran" describir o pronosticar
un determinado fenómeno con cierto grado de certidumbre medible.
El presente material no pretende teorizar el saber estadístico, desde luego, no es un material para
estadísticos, ya que, adrede se obvia el rigor científico de lo expuesto en beneficio de la sencillez
necesaria para el neófito; con un lenguaje coloquial se conduce al estudiante a través del contenido, a
partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados.
La estadística, entonces, dejó de ser una técnica exclusiva de los estados, para convertirse en una
herramienta imprescindible de todas las ciencias, de donde proviene la desconcertante des-uniformidad
en las definiciones de los diferentes autores, ya que cada estudioso la define de acuerdo con lo que
utiliza de ella, se tienen definiciones como que: la estadística es la tecnología del método científico, o
que es el conocimiento relacionado con la toma de decisiones en condiciones de incertidumbre, o que
la estadística son métodos para obtener conclusiones a partir de los resultados de los experimentos o
procesos, o que es un método para describir o medir las propiedades de una población. En fin, no se
trata de discutir si la estadística es una ciencia, una técnica o una herramienta, sino de la utilización de
sus métodos en provecho de la evolución del conocimiento.
La estadística hace inferencias sobre una población, partiendo de una muestra representativa de ella.
Es a partir del proceso del diseño y toma de la muestra desde donde comienzan a definirse las
Mtro. Ozornio 4
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

bondades y confiabilidad de nuestras aseveraciones, hechas, preferentemente, con un mínimo costo y


mínimo error posible.
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de
incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican técnicas estadísticas
para esclarecer la paternidad de un escrito o los caracteres más relevantes de un idioma.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si
se tiene en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre...
y la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con
un determinado grado de confianza.
Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa, lo cual es
un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos
estadísticos. Sin embargo, muchos "investigadores" tendenciosos han cometido abusos con la
estadística, elaborando "investigaciones" de intención, teniendo previamente los resultados que les
interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o
negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y
erróneos que conducen al rotundo fracaso de sus investigaciones.
Lincoln L. Chao (Estadística para ciencias administrativas. 3a ed. México: Mc Graw Hill 1993) hace
referencia a uno de los más estruendosos fracasos, debido a los abusos en la toma de una muestra:
Se trata del error cometido por la Literary Digest que, en sus pronósticos para las elecciones
presidenciales en EE. UU. para 1936, afirmó que Franklin D. Roosvelt obtendría 161 votos electorales
y Alfred Landon, 370. La realidad mostró a Roosvelt con 523 votos y a Landon con 8 solamente.
El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de suscriptores de la
Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y suscripciones a revistas no
configuraban una muestra representativa de los votantes de EE.UU. y, por ende, no podía hacerse un
pronóstico confiable con tan sesgada información.
Ante todo, la estadística es un elemento útil, ya que permite obtener información referida a grandes
grupos de individuos conociendo los datos de sólo unos pocos.
El desarrollo de la Estadística se fundamenta científicamente a partir de los años 30 a raíz de los
problemas planteados en la sociedad industrial, por el desarrollo de otras ramas de las Matemáticas y
de otros campos como la Biología, Medicina, Informática...
Actualmente, la estadística se ha convertido en un método efectivo para describir con exactitud los
valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como
herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya
sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información.
El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando
determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar
datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y
para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.
La sociedad tiene la necesidad de conocer toda esta información, y de acceder a ella de la forma más
resumida posible.
Mtro. Ozornio 5
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Actividades de cierre

A partir de consultar el sitio https://www.ine.es/explica/docs/historia_estadistica.pdf


responda a las siguientes preguntas;
¿Cómo surge la estadística?
¿Cuáles son los principales registros que se han documentado al respecto de la
historia de la estadística, en particular antes de la era cristiana con las civilizaciones
de los egipcios, romanos, chinos y griegos?
¿Qué dice la historia, del desarrollo de la estadística durante la edad media?
¿Qué se sabe del desarrollo de la estadística en la edad Moderna?
¿Qué se sabe del desarrollo de la estadística en la edad contemporánea?
¿Qué relevancia tendrá la estadística como para fija el día mundial de la estadística?
Una vez que haya terminado de dar respuesta a las preguntas, haga llegar su trabajo a su profesor(a)

1.2 Población, muestra y tipos de variables.

Introducción

La mayoría de las ciencias avanza y crea marcos teóricos, comprobando con la


observación directa de todo lo conocido. Un ejemplo es el de las aves, hasta hace
unos cientos de años los biólogos tenían a un conjunto de animales que tenían pico,
todos ellos eran aves, ya sabes; con plumas, dos patas, forma conocida, etc. En base
a ellas se crearon libros, categorías, cursos completos. Cuando se conoció para el
mundo europeo–americano al ornitorrinco, la mayoría de las teorías al respecto se
vinieron abajo.
Con lo anterior queremos establecer que, para hacer una afirmación científica
absoluta, deberíamos conocer a TODOS los elementos que vamos a estudiar, esto es en ocasiones
imposible, de ahí que se han desarrollado técnicas para el análisis de una parte de los elementos a
estudiar.

Mtro. Ozornio 6
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Actividades de Apertura

Reflexiona lo siguiente: Si quisiéramos saber el número de habitantes de un estado o municipio,


tardaríamos varias semanas en contar a todos y cada uno de ellos, cuando finalmente terminamos, ya
nacieron o fallecieron algunos de sus habitantes.
Es por ello que se hacen estudios de una porción de los habitantes y luego se generaliza. Esto también
es aplicable a la industria en general.

Actividades de Desarrollo

1.2.1 Población
La población o Universo es todo conjunto de personas, cosas, objetos, etc., con
ciertas características comunes que puede ser finita o infinita.

1.2.2 Muestra
La Muestra es toda porción de elementos tomada de una población, entre más grande
sea la muestra, será más representativa de la población.

El Muestreo es el procedimiento por el cual se recopila información de los elementos de una muestra,
existen varias formas de realizar el muestreo, unas son más sencillas que otras, otras más económicas
y otras más representativas.

1.2.3 Tipos de variables

Una Variable se puede representar con un símbolo tal como x, y, a, b, que puede tomar un valor
cualquiera. Si esta variable solamente toma un valor, se le llama Constante.

Alumno Promedio
Francisco 9.2
Felipe 8.7 Variable
Raúl 9.5
Jaime 8.0

En este caso el promedio es la variable.

Mtro Ozornio 7
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

1.2.3.1. Variables cualitativas


Las variables cualitativas son aquellas que describen las cualidades o características de un objeto o
evento mediante palabras, frases, letras, etc. Son subjetivas de acuerdo con el observador. Por
ejemplo, si deseamos describir el estado de conservación de una bicicleta, alguien podría decir que su
estado es muy bueno, mientras que otra la calificaría como Bueno.
Las variables cualitativas se clasifican en:
Variables Nominales son las más simples y abundantes, su única función es la de clasificar en
categorías y su orden es indistinto. NO tiene sentido realizar operaciones aritméticas con ellas.
Ejemplo

Aquí los números carecen de propiedades solo sirven para distinguir un estado civil
de otro, no significa que un estado civil sea mejor o mayor que otro.

Variables Ordinales clasifican las observaciones en categorías que exigen ordenación, su variable
operacional es una escala ordinal de mayor a menor.

1.2.3.2. Variables cuantitativas


Las variables cuantitativas son aquellas que se pueden representar por una cantidad numérica
exacta, por lo general son medidas objetivas, es decir que no depende de quien realice la medición. En
ocasiones puede tener un pequeño error dependiendo del instrumento con que se mida.
Las variables cuantitativas se clasifican en:

1.2.3.3. Variables Discretas


Variables Discretas son las que toman solo algunos valores dentro de un intervalo, por ejemplo,
valores enteros. Al indicar el número de hijos que tiene una familia, el número de
recámaras de una casa, el número de mascotas, etc.
Ejemplo

Mtro Ozornio 8
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

1.2.3.4. Variables Continuas


Variables Continuas Son las que pueden tomar cualquier valor fijo dentro de un intervalo, siempre
entre dos valores observables, va a existir un tercer valor intermedio, que también podría tomar la
variable continua.

Ejemplo

Una variable continua toma valores a lo largo de un continuo, esto es, en todo un
intervalo de valores. Un atributo esencial de una variable continua es que, a diferencia
de una variable discreta, nunca puede ser medida con exactitud; el valor observado depende en gran
medida de la precisión de los instrumentos de medición. Con una variable continua hay inevitablemente
un error de medida.
La siguiente gráfica resume los dos tipos de variables:

Cualitativa
Tipos de o categórica
Discreta
variables
Cuantitativa
o numérica
Continua

1. Señala con una palomita el tipo de escalas de medida a la que pertenece cada una de las variables
siguientes:
No. Variables Nominal Ordinal De intervalo Continuas
Discretas De razón
1 Peso de una persona
2 La raza de un perro
3 Frecuencia cardiaca
4 Grado de una enfermedad
5 Marca de un automóvil
6 La escolaridad de una persona
7 Nacionalidad
8 Cantidad de Hemoglobina
9 Lugar de nacimiento
10 Número de hijos

Mtro Ozornio 9
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Actividades de cierre

1. En tu cuaderno, elabora un mapa conceptual de los tipos de variables y las categorías de los datos.
En la elaboración de tu mapa incluye algunos ejemplos.

Mtro Ozornio 10
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

1.4 Frecuencias

Introducción

Agrupar datos y clasificarlos son tareas importantes para producir información. En


las tablas estadísticas de frecuencias, cada clase tiene una frecuencia de la clase,
que es el número de mediciones que se pueden agrupar en ella. Con las clases y
sus frecuencias se construye la tabla de frecuencias, también llamada distribución
de frecuencias, de la que se obtiene la frecuencia relativa de cada clase.

Actividades de Apertura

La frecuencia estadística es la cantidad de veces que se repite una observación


durante la realización de un muestreo.
1.4.1. Frecuencia Absoluta (acumulada)

Se le llama frecuencia absoluta al número de veces que se repite una variable


en un experimento. Esta se representa con fi ó ni.
Frecuencia absoluta acumulada
La frecuencia acumulada es aquella que se obtiene al sumar todas las frecuencias
absolutas inferiores o iguales al valor en cuestión.

1.4.2. Frecuencia Relativa (acumulada)

Representa la cantidad de veces que se repite una observación, expresada como proporción de la
muestra, es decir, es el resultado de dividir el valor de la frecuencia absoluta por el tamaño de la muestra
estadística.
Esta se representa con fr .y se define como f = n/N, siendo n el número de veces que se repite la
respuesta y N el tamaño de la muestra. Su valor se expresa como porcentaje.
Frecuencia relativa acumulada
En esta se tiene en cuenta la sumatoria de todas las frecuencias relativas inferiores o iguales al valor
en cuestión. Se representa con fr.
La frecuencia relativa acumulada de la clase 𝒊 es igual a la suma de las frecuencias relativas de todas
las clases anteriores a ella más la de la clase 𝒊.i

Mtro Ozornio 11
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Actividades de Desarrollo

1. Analiza los siguientes ejemplos desarrollados, ya que esto te permitirá poder utilizar esta información
más adelante en tablas más complejas para encontrar las medidas de tendencia central o de dispersión.
Ejemplo 1.

En una construcción se pesaron las vigas de 50 pilotes libras, cuyos resultados se


anotan a continuación.

88 106 107 145 142 91 103 87 130 99


132 144 112 89 137 110 139 105 147 119
123 108 133 111 122 123 94 145 113 146
109 108 88 120 138 91 135 145 110 95
100 137 110 137 142 120 113 140 136 150

Más adelante observarás la explicación para ordenar los datos, en este espacio te explicaré como
retomar las frecuencias y colocarlas en la siguiente tabla.
Al ordenar los datos en esta tabla puedo empezar a retomar los datos que se repiten a esto le
llamaremos frecuencias
Tabla 1. Velocidad de automóviles en una autopista.
Frecuencia Frecuencia
Peso en libras Frecuencia absoluta Relativa
Clase Acumulada
𝒇𝒊 = 𝒇
𝒇𝒓 𝒄𝒇

1 87 - 95 8 0.16 8
2 96 - 104 3 0.06 11
3 105 - 113 13 0.26 24
4 114 - 122 4 0.08 28
5 123 - 131 3 0.06 31
6 132 - 140 10 0.2 41
7 141 - 149 8 0.16 49
8 150 - 158 1 0.02 50
N=n=∑ 𝒇 =50 1

Observa que la suma de la frecuencia relativa siempre será la unidad, en el caso de la frecuencia
acumulada no se suma ya que esta acumulada dando el total de las frecuencias.

Mtro Ozornio 12
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Actividades de cierre

En este caso se está agregando una columna para que agregues la frecuencia relativa acumulada.
Vida de una pieza metálica.

1. Una máquina para triturar piedra utiliza una pieza metálica sujeta a rotación y fricción. Esa pieza
tiene lo que se llama un “tiempo” de vida útil”. El productor de las máquinas realiza frecuentemente
pruebas a la pieza para conocer cuántas horas de duración de la pieza debe garantizarles a los
clientes. En la siguiente tabla se muestran los resultados de la distribución de frecuencias de los
tiempos de vida obtenidos en las 60 piezas.

Tabla 3. Duración de las piezas en una hora.

Clase Intervalo de Frecuencia Frecuencia Frecuencia Frecuencia


clase: HORAS 𝒇 Relativa 𝒇𝒓 Acumulada Relativa
(H) 𝒄𝒇 Acumulada

1 2900 - 3100 5

2 3101 - 3301 8

3 3302 - 3502 12

4 3503 - 3703 25

5 3704 - 3904 10

Total

Actividades de contexto o Transversales

1. Analiza los siguientes ejercicios como reforzamiento del tema analizado anteriormente Frecuencias
absoluta y relativa, frecuencia acumulada y completa las tablas.

a) Los siguientes datos de la tabla muestra la distribución de frecuencias de tiempos de una


muestra, tomada al azar de la duración en segundos de comerciales transmitidos por la
televisión comercial en el horario de las 20:00 hrs. a las 23:00 hrs. tomada en un periodo de dos
años. No se repite un comercial en la muestra.

Mtro Ozornio 13
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Intervalo Real de Frecuencia Frecuencia Frecuencia


Frecuencia
Clase clase: Relativa Acumulada Relativa
𝒇
𝑻 𝒇𝒓 𝒄𝒇 Acumulada

1 5< T ≤10 23
2 10 <T ≤15 66
3 15< T ≤20 49
4 20< T ≤25 16
5 25< T ≤30 4
6 30< T ≤35 2
Totales 160

Mtro Ozornio 14
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

b) Se realiza una investigación acerca del punto de fusión del plomo (Temperatura a la cual cambia
de sólido a líquido). Se trabaja en un laboratorio con temperatura controlada a 26𝑜𝐶 en crisoles
de acero (Fuente de fuego de precisión e instrumentos de medición de calidad), Los datos de
una muestra de 100 observaciones se han vaciado en la tabla de distribución de frecuencias
siguiente:

Intervalo
Frecuencia Frecuencia Frecuencia
:Temperatura de Frecuencia
Clase Relativa Acumulada Relativa
fusión en 𝒇
𝒇𝒓 𝒄𝒇 Acumulada
º𝑪

1 326< C ≤326.4 8

2 326.4< C ≤326.8 12

3 326.8< C ≤327.2 70

4 327.2< C ≤327.6 7

5 327.6< C ≤328 3

Totales n=

Mtro Ozornio 15
PROBABILIDAD Y ESTADíSTICA: APRENDIZAJES ESENCIALES

Mtro Ozornio 16
Probabilidad y Estadística: Aprendizajes Esenciales

Bloque 2 | Medidas de tendencia central


_______________________________________________________________________________________________________________

2.1 Media

Introducción

La tendencia central se refiere al punto medio de una distribución. Las medidas de


tendencia central se conocen también como medidas de posición. Las tres medidas de
tendencia central o de centralización más importantes son la Media Aritmética o
media, Mediana y Moda.

Media

Un valor que es simbólico y representativo de un conjunto de datos se denomina


promedio. Se hace notar que en un conjunto de datos ordenados de acuerdo con su
magnitud, el promedio siempre tiende a situarse en el centro de dicho conjunto, razón
por la cual los promedios se denominan también medidas de centralización o de
tendencia central.

2.1.1. Media aritmética

Es el promedio más utilizado y por lo general se denomina media. La media aritmética o media de un
conjunto de elementos se define como la suma de los valores de estos elementos dividido entre el
número total de ellos. Se simboliza 𝑋̅ (léase 𝑋̅ barra), para datos no agrupados, matemáticamente se
determina por la ecuación:

∑ 𝑿𝒊 𝑿𝟏 + 𝑿𝟐 + 𝑿𝟑 + ⋯ + 𝑿𝑵
̅=
𝑿 =
𝑵 𝑵

Donde:
𝑋̅= Media aritmética o media.
𝑋= Valor de cada elemento.
𝑁= Número total de elementos.

Ejemplo:
Determina la media aritmética de los números 18, 13, 15, 22 y 20.

18 + 13 + 15 + 22 + 20 88
𝑋̅ = = = 𝟏𝟕. 𝟔
5 5

DGETI Academia Nacional de Matemáticas 60


Probabilidad y Estadística: Aprendizajes Esenciales

Media aritmética para datos agrupados.

Cuando los datos se presentan agrupados mediante una distribución de frecuencias, todos los
valores caen dentro de los intervalos de clase dados que se consideran coincidentes con las marcas
de clase o puntos medios de cada intervalo, es decir, las ponderaciones son las frecuencias y las
marcas de clase o puntos medios son los valores que se ponderan.
En una distribución de frecuencias para datos agrupados, la media aritmética se determina al
multiplicar las distintas marcas o puntos medios de clase por sus respectivas frecuencias de clase; se
suman los productos y el resultado se divide entre el número total de frecuencias. Matemáticamente se
representa:

∑𝒇 𝑿
̅=
𝑿
𝑵
Donde:

𝑋̅= Media aritmética o media.


𝑋= Marcas o puntos medios de clase.
𝑓= Frecuencia total de clase.
𝑁= Número total de frecuencias.

Ejemplo:

La siguiente tabla de distribución de frecuencias representan las edades de los 96 asistentes a


un curso de informática.

Intervalos Frecuencias Marca de clase


𝒇𝑿
(edades) (asistentes) (𝑿)
24 - 28 26 8 208
29 - 33 31 17 527
34 - 38 36 29 1 044
39 - 43 11 23 943
44 - 48 46 15 690
49 - 53 51 4 204
𝑁= 96 ∑ 𝑓 𝑋 = 3 616

Al sustituir los datos anteriores en la ecuación para la media aritmética resulta:

∑𝑓 𝑋 3 616
𝑋̅ = = = 37.666
𝑁 96

La media aritmética de las edades es 37.666 años.

DGETI Academia Nacional de Matemáticas 61


Probabilidad y Estadística: Aprendizajes Esenciales

2.2 Mediana y Moda

2.2.1 Mediana

Se define como el valor medio a aquel que divide a un conjunto de datos que se
ordena de acuerdo con su magnitud (de forma ascendente o de forma descendente)
en dos partes iguales, es decir, es aquel valor central que deja por debajo igual
número de elementos que por arriba de él.

Si el conjunto de elementos ordenados de acuerdo con su magnitud, es impar, la


mediana será el valor intermedio de dicha sucesión. Si el conjunto de elementos
ordenados de acuerdo con su magnitud es par, la mediana será la media aritmética
de los dos elementos medios.

Ejemplos:

1. Determina la mediana de los números 25, 29, 24, 29, 27, 25, 29, 31, 26

Solución:
Al ordenar ascendentemente el conjunto de elementos numéricos dado tenemos:

24,25, 25, 26, 27, 29, 29, 29, 31

Por definición, la mediana de los números es el valor central, en este caso es 27.

2. Determina la mediana de los números 49, 38, 46, 40, 36, 42, 36, 43

Solución:
Al ordenar descendentemente el conjunto de elementos numéricos dado se tiene:

49, 46, 43, 42, 40, 38, 36, 36

La mediana es la media aritmética de los números 42 y 40, es decir:

42 + 40
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 41
2

La mediana del conjunto de elementos numéricos dados es 41

Mediana para datos agrupados.

Para determinar la mediana en datos agrupados se emplea el método de la interpolación coma


es decir, se fundamenta de la suposición de que los elementos en la clase mediana (es la clase en la
cual se localiza el valor de la mediana) están distribuidos uniformemente en todo el intervalo.

DGETI Academia Nacional de Matemáticas 62


Probabilidad y Estadística: Aprendizajes Esenciales

El cálculo de la mediana de una distribución de frecuencias se determina matemáticamente por la


ecuación:
𝑵
− ∑ 𝒇𝟏
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑳𝑹𝟏 + [ 𝟐 ]𝑪
𝒇 𝒎𝒆𝒅𝒊𝒂𝒏𝒂
Donde:

𝐿𝑅1 = Límite real inferior de la clase mediana, es decir, la clase que contiene el valor de la
mediana.
𝑁= Número total de datos, es decir, la frecuencia total.
∑ 𝑓1 = Suma de las frecuencias de todas las clases por debajo de la clase mediana.
𝑁
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎= Frecuencia de la clase mediana, la cual nunca debe ser mayor que 2
𝐶= El tamaño del intervalo de la clase mediana.

Ejemplo:

La siguiente tabla de distribución de frecuencias muestra las puntuaciones que obtuvieron durante el
primer parcial 56 estudiantes en un examen de geometría analítica. Calcula la mediana.

Solución:

𝑁 56
Se localiza la clase mediana: 2
= 2
= 28

La suma de las frecuencias de las cuatro y cinco primeras clases es 1 + 3 + 7 + 12 = 23 y 1 + 3


+ 7 + 12 + 15 =38 , respectivamente, por lo que es evidente que la mediana se encuentra en la quinta
clase, qué será, por lo tanto, la clase mediana.

Entonces observamos los siguientes datos:

73 + 72
𝐿𝑅1 = = 72.5
2
𝑁 = 56
∑ 𝑓1 = 23
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 15
𝐶=7
DGETI Academia Nacional de Matemáticas 63
Probabilidad y Estadística: Aprendizajes Esenciales

Al sustituir los datos anteriores en la ecuación de la mediana, resulta:

𝑁 56
− ∑ 𝑓1 − 23
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝐿𝑅1 + [ 2 ] 𝐶 = 72.5 + [ 2 ] (7)
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 15

28 − 23 5
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 72.5 + [ ] (7) = 72.5 + ( ) (7)
15 15

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 72.5 + 2.33 = 74.83 ≈ 75

La media de las puntuaciones calculada a partir de datos agrupados es 75

2.2.2 Moda

Se define como el valor que se presenta con la mayor frecuencia, es decir, es el


valor más común de un conjunto de elementos numéricos dado.

Entre las características de la moda destacan que ésta puede no existir, incluso si
existe puede no ser única. Si un conjunto de valores dado presenta una sola moda
se denomina unimodal. Sí presenta dos modas se denomina bimodal; si
presentan más de dos modas se denomina multimodal.

Ejemplos 1: Dado el siguiente conjunto de números 4, 6, 8, 10, 12, 14, 16, 18, 20; determina su moda.

Solución: Analizando el conjunto de números dados, se observa que todos ellos tienen igual
frecuencia, por lo que se concluye que no presenta moda, es decir, no existe.

Ejemplos 2: Dado el siguiente conjunto de números 3, 3, 4, 6, 8, 8, 8, 11, 11, 13, 15; determina su
moda.

Solución: Analizar el conjunto de números dado, se observa que el número que se presenta con
mayor frecuencia es el 8, por lo que se concluye que el valor de la moda es 8 y el conjunto se denomina
unimodal.

Ejemplos 3: Dado el siguiente conjunto de números 10, 12, 12, 12, 13, 14, 14, 14, 15, 15, 16, 17, 17,
17, 19; determina su moda.

Solución: Al analizar el conjunto de números dado, se observa que los números que se presentan
con mayor frecuencia son el 12, 14 y 17, por lo que se concluye que los valores de la moda son 12,
14 y 17, en donde el conjunto se denomina multimodal.

DGETI Academia Nacional de Matemáticas 64


Probabilidad y Estadística: Aprendizajes Esenciales

Moda para datos agrupados.

Para determinar la moda en datos agrupados se emplea el método de la interpolación, es decir, se


fundamenta en encontrar primero la clase modal (es la clase en la cual se localiza el valor de la moda)
que se caracteriza por tener la máxima frecuencia de la distribución.

El siguiente paso es determinar la diferencia absoluta entre la frecuencia de la clase modal y la


frecuencia de la clase premodal o anterior; así mismo, la diferencia absoluta entre la frecuencia de la
clase modal y la frecuencia de la clase posmodal o siguiente. Lo anterior es con el fin de observar
hacia dónde se concentra el valor modal.

El cálculo de la moda de una distribución de frecuencias se determina matemáticamente por la


ecuación:

∆𝟏
𝑴𝒐𝒅𝒂 = 𝑳𝑹𝟏 + ( )𝑪
∆𝟏 + ∆𝟐

Donde:

𝐿𝑅1 = Límite real inferior de la clase modal, es decir, la clase que contiene el valor de la moda.

∆1 = Es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase


premodal o anterior.

∆2 = Es la diferencia absoluta entre la frecuencia de la clase modal y la frecuencia de la clase


posmodal o siguiente.

𝐶 = Tamaño del intervalo de clase modal

Ejemplo 1:

La siguiente tabla de distribución de frecuencias agrupa los salarios semanales en miles de pesos de
130 empleados técnicos de la empresa TRW, división de cinturones de seguridad; determina la moda
de dichos salarios.

Solución: Primero, se considera la tabla de distribución de frecuencias para localizar la clase modal
que se caracteriza por tener la máxima frecuencia y el valor de la moda que resulta ser (750 – 773).

DGETI Academia Nacional de Matemáticas 65


Probabilidad y Estadística: Aprendizajes Esenciales

Intervalos Frecuencias
(salarios) (empleados)
654 - 677 3
678 - 701 7
702 - 725 13
726 - 749 19 ∆1 = 26 − 19 = 7
Clase modal 750 - 773 26
774 - 797 21 ∆2 = 26 − 21 = 5
798 - 821 17
822 - 845 12
846 - 869 8
870 - 893 4
N= 130

También se observan los siguientes datos:

𝐿𝑅1 = El límite real inferior de la clase modal se obtiene sumando el límite superior de un intervalo de
clase y el límite inferior de intervalo de clase contiguo superior y dividido entre dos, es decir:

749 + 750
𝐿𝑅1 = 749.5
2
𝐿𝑅1 = 749.5
∆1 = 26 − 19 = 7
∆2 = 26 − 21 = 5
𝐶 = 23

Al sustituir los datos anteriores en la ecuación de la moda resulta:

∆𝟏 𝟕
𝑴𝒐𝒅𝒂 = 𝑳𝑹𝟏 + ( ) 𝑪 = 𝟕𝟒𝟗. 𝟓 + ( ) (𝟐𝟑)
∆𝟏 + ∆𝟐 𝟕+𝟓

𝑀𝑜𝑑𝑎 = 749.5 + 13.42 = 𝟕𝟔𝟐. 𝟗𝟐

La moda de los salarios calculada a partir de datos agrupados es 762. 92 miles de pesos.

DGETI Academia Nacional de Matemáticas 66


Probabilidad y Estadística: Aprendizajes Esenciales

Actividades de Apertura

1. La siguiente tabla de distribución de frecuencias muestra el número de horas a la semana que 60


familias miran programas televisivos; determina la media aritmética.

Intervalos Frecuencias Marca de clase fX


(horas) (familias) X
30 - 39 4
40 - 49 9
50 - 59 13
60 - 69 19
70 - 79 12
80 - 89 3
𝑁= 60

∑𝑓 𝑋
𝑋̅ = =
𝑁

DGETI Academia Nacional de Matemáticas 67


Probabilidad y Estadística: Aprendizajes Esenciales

Actividades de Desarrollo

1. Con los datos de la tabla de distribución de frecuencias anterior, calcula:

a) La mediana por fórmula


b) La moda
c) Constuye el Histograma

Intervalos Frecuencias
(horas) (familias)
30 - 39 4
40 - 49 9
50 - 59 13
60 - 69 19
70 - 79 12
80 - 89 3
𝑁= 60

Actividades de cierre

1. Realiza la siguiente actividad en una hoja de cálculo Excel para determinar lo que se te solicita:

La siguiente tabla de Distribución de frecuencias registra el número de horas al mes que 180 miembros
de un club altruista dedican a labores sociales en su comunidad.

Determinar:

a) La media aritmética
b) La mediana
c) La moda
d) Construye el Histograma

DGETI Academia Nacional de Matemáticas 68


Probabilidad y Estadística: Aprendizajes Esenciales

Frecuencias Marca de
Intervalos
(miembros) clase fX
(horas)
f X
10 - 14 6
15 - 19 14
20 - 24 23
25 - 29 28
30 - 34 19
35 - 39 11
40 - 44 7

Solución: N= 108 ∑𝑓 𝑋 =

a) 𝑋̅ = __________ℎ𝑜𝑟𝑎𝑠 b) 𝑀𝑒 = __________ℎ𝑜𝑟𝑎𝑠 c) 𝑀𝑜 = __________ℎ𝑜𝑟𝑎𝑠

Ejercicios Adicionales

Como reforzamiento de los temas vistos, realiza los siguientes ejercicios:

1. Resuelve los siguientes problemas para Datos No Agrupados.


a) Determina la media aritmética, la mediana y la moda para los siguientes conjuntos de datos
numéricos. Menciona también qué tipo de moda resulta en cada uno (unimodal, bimodal o
multimodal).
a) 125, 116, 119, 121, 121, 124, 129
b) 8, 12, 16, 8, 10, 12, 10, 14, 10, 12, 10, 8, 10

b) El costo de un litro de gasolina magna sin en diferentes municipios de la franja fronteriza de la


República Mexicana, registrado en el año 2019 es: $15.99, $11.62, $13.50, $15.48, $12.00,
$13.50. Determina:
i) La media aritmética de los costes.
ii) La mediana de los costes.
iii) La moda de los costes.
iv) Indica el tipo de moda.

c) Doce vendedores de autos usados vendieron en una semana, respectivamente, 59, 72, 86, 45,
64, 48, 69, 90, 43, 95, 64 y 81 automóviles. Determina:
i) La media aritmética.
ii) La mediana.
iii) La moda e indica el tipo de moda que resulta.

DGETI Academia Nacional de Matemáticas 69


Probabilidad y Estadística: Aprendizajes Esenciales

2. Resuelve los siguientes problemas para Datos Agrupados.

a) La tabla de distribución de frecuencias registra la cantidad de adultos en una población a partir


de los 30 años, arrojando los siguientes resultados:

FRECUENCIA MARCA DE
INTERVALO fX
f CLASE X
30 - 39 7
40 - 49 12
50 - 59 19
60 - 69 16
70 - 79 10
80 - 89 6
90 - 99 2
N = 72 ∑𝑓 𝑋 =

Calcula los valores de:


i) La media aritmética
ii) La mediana
iii) La moda
iv) Construye el Histograma

b) En la siguiente tabla de distribución de frecuencias se muestran las estaturas de un grupo de


202 estudiantes. Calcule la media mediana, moda y construye el gráfico de histograma en una
hoja de cálculo Excel.

MARCA DE
INTERVALO FRECUENCIA
CLASE fX
(estaturas) f
X
152 - 156 25
157 - 161 18
162 - 166 36
167 - 171 55
172 - 176 53
177 - 181 15
N = 202
Soluciones:
i) 𝑋̅ = 𝑑𝑒 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎
ii) 𝑀𝑒 = 𝑑𝑒 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎
iii) 𝑀𝑜 = 𝑑𝑒 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎

DGETI Academia Nacional de Matemáticas 70


Probabilidad y Estadística: Aprendizajes Esenciales

2.3 Cuartiles, deciles y percentiles

Introducción

Dado un conjunto de elementos que se ordenan de acuerdo con su magnitud, el valor


medio que divide al conjunto de datos en dos partes iguales o la media aritmética de
los valores medios de dicho conjunto, dan como resultado a la mediana.

Asociadas a la definición de mediana, tenemos otras medidas que se fundamentan en


las divisiones proporcionales que pueden hacerse en datos agrupados o sin agrupar
y que se denominan cuartiles. Existen diferentes tipos: Cuartiles, Deciles y
Percentiles.

2.3.1. Cuartiles

Se definen como los intervalos dentro de los cuales quedan proporcionalmente repartidos los datos sin
agrupar o agrupados en una distribución formada por 4 partes iguales.

Se tienen 3 cuartiles que se simbolizan por 𝑄1 (primer cuartil), 𝑄2 (segundo cuartil) y 𝑄3 (tercer cuartil),
en donde cada uno contendrá el mismo número de datos, es decir, el 25% del total.

𝑲𝑵
Para determinar el valor de los cuartiles en datos no agrupados, aplicamos la expresión general 𝟒
y las siguientes reglas:
a) Si KN es divisible exactamente 4, el valor del cuartil buscado será la media aritmética entre el
𝑲𝑵
dato ordenado cuya posición se obtiene de 𝟒
y el siguiente dato de orden.
b) Si KN no es divisible exactamente entre 4, el valor del cuartil buscado será el dato ordenado
𝐾𝑁
cuya posición si obtiene de redondear al entero más próximo el resultado de 4
.

El cálculo de los cuartiles de una distribución de frecuencias o datos agrupados se determina


matemáticamente por la ecuación general:
𝐾𝑁
− ∑𝑓
𝑄𝐾 = 𝐿𝑅1 + [ 4 ]𝐶
𝑓𝑘
Donde:

𝐾= K-enésimo cuartil = Se refiere al primero, segundo y tercer cuartil, según sea el que se tenga
que determinar.
𝐿𝑅1 = Límite real inferior de la clase K-enésimo cuartil.
𝑁= Número total de datos, es decir, la frecuencia total.
∑ 𝑓= Suma de las frecuencias de todas las clases por debajo de la clase de K-enésimo cuartil.
𝐾𝑁
𝑓𝑘 = Frecuencia de la clase del K-enésimo cuartil, la cual nunca debe ser mayor que 4
𝐶= Tamaño del intervalo de la clase del K-enésimo cuartil.

DGETI Academia Nacional de Matemáticas 71


Probabilidad y Estadística: Aprendizajes Esenciales

2.3.2 Deciles

Se definen como los intervalos dentro de los cuales quedan proporcionalmente


repartidos los datos sin agrupar o agrupados en una distribución formada por 10 partes
iguales. Se tienen nueve deciles que se simbolizan por 𝐷1 (primer decil), 𝐷2 (segundo
decil), 𝐷3 (tercer decil), …, 𝐷9 (noveno decil), en donde cada uno contendrá el mismo
número de datos, es decir, el 10% del total.

Para determinar el valor de los deciles en datos no agrupados, aplicamos la expresión


𝑲𝑵
general 𝟏𝟎
.

El cálculo de los deciles de una distribución de frecuencias o datos agrupados se determina


matemáticamente por la ecuación general:

𝑲𝑵
− ∑𝒇
𝑫𝑲 = 𝑳𝑹𝟏 + [ 𝟏𝟎 ]𝑪
𝒇𝒌
Donde:

𝐾= K-enésimo decil = Se refiere al primero, segundo, tercero,…, noveno decil, según sea el que
se tenga que determinar.
𝐿𝑅1 = Límite real inferior de la clase K-enésimo decil.
𝑁= Número total de datos, es decir, la frecuencia total.
∑ 𝑓= Suma de las frecuencias de todas las clases por debajo de la clase de K-enésimo decil.
𝐾𝑁
𝑓𝑘 = Frecuencia de la clase del K-enésimo decil, la cual nunca debe ser mayor que
10
𝐶= Tamaño del intervalo de la clase del K-enésimo decil.

2.3.3 Percentiles

Se define como los intervalos dentro de los cuales quedan proporcionalmente


repartidos los datos sin agrupar o agrupados en una distribución formada por cien
partes iguales.

Se tienen noventa y nueve percentiles que se simbolizan por 𝑃1 (primer percentil),


𝑃2 (segundo percentil), 𝑃3 (tercer percentil),…, 𝑃99 (noventa y nueve percentil), en
donde cada uno contendrá el mismo número de datos, es decir, el 1% del total.

Para determinar el valor de los percentiles en datos no agrupados, aplicamos la


𝑲𝑵
expresión general 𝟏𝟎𝟎.

DGETI Academia Nacional de Matemáticas 72


Probabilidad y Estadística: Aprendizajes Esenciales

El cálculo de los percentiles de una distribución de frecuencias o datos agrupados se determina


matemáticamente por la ecuación general:

𝑲𝑵
𝟏𝟎𝟎 − ∑𝒇
𝑷𝑲 = 𝑳𝑹𝟏 + [ ]𝑪
𝒇𝒌
Donde:

𝐾= K-enésimo percentil = Se refiere al primero, segundo, tercero,…, nonogésimo noveno


percentil, según sea el que se tenga que determinar.
𝐿𝑅1 = Límite real inferior de la clase K-enésimo percentil.
𝑁= Número total de datos, es decir, la frecuencia total.
∑ 𝑓= Suma de las frecuencias de todas las clases por debajo de la clase de K-enésimo percentil.
𝐾𝑁
𝑓𝑘 = Frecuencia de la clase del K-enésimo percentil, la cual nunca debe ser mayor que
100
𝐶= Tamaño del intervalo de la clase del K-enésimo percentil.

Ejemplo para datos no agrupados:

Para el siguiente conjunto de datos ordenados:

76, 77, 81, 82, 83, 88, 92, 95, 99, 102, 105, 107, 108, 110, 112, 116, 119, 123, 125, 128, 131, 135, 137,
140, 142, 146, 149, 152, 155, 158, 161, 164, 166, 168, 171.

Determina el 𝑄3 , 𝐷6 y 𝑃70 .

Solución:

Como el conjunto tiene 𝑁 = 35 datos:

𝐾𝑁 3(35)
a) 𝑄3 = 4
= 4
= 26.25 ≈ 26 redondeado al entero más próximo.

𝐾𝑁 6(35)
b) 𝐷6 = = = 21 el valor del 𝐷6 será la media aritmética entre el 21° dato ordenado y el
10 10
siguiente del conjunto, es decir,

131+135
𝐷6 = 2
= 133 El valor del 𝐷6 es 133.

𝐾𝑁 70(35)
c) 𝑃70 = 100 = 100
= 24.5 ≈ 25 redondeado al entero más próximo.

DGETI Academia Nacional de Matemáticas 73


Probabilidad y Estadística: Aprendizajes Esenciales

Ejemplo para datos agrupados:

La siguiente tabla de distribución de frecuencias registran los pesos en libras de 42 atletas mexicanos
que participaron en los XXIX Juegos Olímpicos en Beijing en 2008.

Encuentra: Intervalos Frecuencias


(libras) (atletas)
a) Cuartil 𝑄1 110 - 116 2
b) Decil 𝐷9 117 - 123 4
c) Percentil 𝑃65 124 - 130 7
131 - 137 9
138 - 144 13
145 - 151 6
152 - 158 1
Solución: 𝑁= 42

a) Para determinar el primer cuartil 𝑄1 , usamos los siguientes datos:


Datos Formula Sustitución
𝐾𝑁 10.5 − 6
𝐾𝑁 1(42) −∑𝑓 𝑄1 = 123.5 + [ ] (7)
= = 10.5 𝑄1 = 𝐿𝑅1 + [ 4 ]𝐶 7
4 4 𝑓𝑘

𝑄1 = 123.5 + 4.5 = 128


123 + 124
𝐿𝑅1 = = 123.5
2
∑𝑓 = 2 + 4 = 6
𝑓𝑘 = 7 El valor del primer cuartil es 128 libras, es decir,
𝐶=7 25% de los atletas pesa 128 libras o menos.

b) Para determinar el noveno decil 𝐷9 , usamos los siguientes datos:

Datos Formula Sustitución

𝐾𝑁 9(42) 𝐾𝑁 37.8 − 35
= = 37.8 − ∑𝑓 𝐷9 = 144.5 + [ ] (7)
10 10 𝐷9 = 𝐿𝑅1 + [ 10 ]𝐶 6
𝑓𝑘

𝐷9 = 144.5 + 3.27 = 147.77


144 + 145
𝐿𝑅1 = = 144.5
2
∑ 𝑓 = 2 + 4 + 7 + 9 + 13 = 35
𝑓𝑘 = 6 El valor del noveno decil es 147.77 libras, es decir,
𝐶=7 90% de los atletas pesa 147.77 libras o menos.

DGETI Academia Nacional de Matemáticas 74


Probabilidad y Estadística: Aprendizajes Esenciales

c) Para determinar el sexagésimo quinto percentil 𝑃65 , usamos los siguientes datos:

Datos Formula Sustitución

𝐾𝑁
𝐾𝑁 65(42) − ∑𝑓
= = 27.3 𝑃65 = 𝐿𝑅1 + [ 100 ]𝐶 27.3 − 22
100 100 𝑓𝑘 𝑃65 = 137.5 + [ ] (7)
13

𝑃65 = 137.5 + 2.85 = 140.35

137 + 138
𝐿𝑅1 = = 137.5
2
∑ 𝑓 = 2 + 4 + 7 + 9 = 22
𝑓𝑘 = 13
𝐶=7 El valor del sexagésimo quinto percentil es 140.35 libras,
es decir, 65% de los atletas pesa 143.75 libras o menos.

Actividades de Apertura

1. La siguiente tabla de distribución de frecuencias Registra los tiempos en segundos que 35 atletas
varones tardan en recorrer los 100 metros planos. Determina:

a) Los cuartiles: 𝑄1 y 𝑄2 ;
b) Los deciles: 𝐷3, 𝐷6 y 𝐷9
c) Los percentiles 𝑃35 , 𝑃50 , 𝑃65 y 𝑃80 .

Intervalos Frecuencias
(segundos) (atletas)
8.8 - 9.2 2
9.3 - 9.7 5
9.8 - 10.2 13
10.3 - 10.7 9
10.8 - 11.2 6
𝑁= 35

DGETI Academia Nacional de Matemáticas 75


Probabilidad y Estadística: Aprendizajes Esenciales

Bloque 5 | Medidas de correlación


__________________________________________________________________________

5.1 Coeficiente de correlación

Introducción

Hasta este momento se han abordado los cálculos de diferentes medidas que nos
describen un comportamiento general, su distribución y sus tendencias de una variable.
Las medidas de correlación permiten relacionar diversas variables y determinar si
tienen o no dependencia alguna entre ellas.

Actividades de Apertura

Revisa la siguiente lección:” Introducción a la Correlación”,


https://www.youtube.com/watch?v=KNf5soJ4_yk

Actividades de Desarrollo

En el departamento de orientación educativa se están organizando conferencias para orientar a los


estudiantes en la elección de su carrera a elegir, se buscará la mejor orientación basados en sus
calificaciones que determinan sus actitudes y capacidades. Para facilitar la obtención de información al
estudiante, se analizarán correlaciones entre sus calificaciones de dos de sus materias, por ejemplo,
para el área de físico-matemáticas, se tomarían de Álgebra, Geometría, Cálculo, Física o Química.

DGETI Academia Nacional de Matemáticas 98


Probabilidad y Estadística: Aprendizajes Esenciales

Tomemos los siguientes datos de 10 alumnos para ver la relación de sus materias:

Alumno Cálculo Integral Física


Alumno 1 48 56
Alumno 2 53 77
Alumno 3 77 82
Alumno 4 44 67
Alumno 5 69 85
Alumno 6 79 86
Alumno 7 84 93
Alumno 8 68 76
Alumno 9 61 58
Alumno 10 55 45

De la tabla de calificaciones, contesta y desarrolla lo que se te pide a continuación:


a) Al graficar esta información, usando como abscisas las calificaciones de Cálculo integral y como
ordenadas las calificaciones de Física, donde cada punto (𝑥, 𝑦) será registrado calificación por
alumno.

Si observas los puntos del gráfico anterior, ¿qué tendencia muestra el conjunto?

Para conocer o dar una respuesta certeza a la pregunta del inciso b) calculemos el coeficiente de
correlación “r”
DGETI Academia Nacional de Matemáticas 99
Probabilidad y Estadística: Aprendizajes Esenciales

Tomemos Cálculo Integral como la variable X y Física como la variable Y.


Completemos la tabla con la información que necesitamos:

x y
Cálculo Física

48 56 -15.8 -15.2 240.16 249.64 231.04


53 64 -10.8 -7.2 77.76 116.64 51.84
77 82 13.2 10.8 142.56 174.24 116.64
44 67 -19.8 -4.2 83.16 392.04 17.64
69 85 5.2 13.8 71.76 27.04 190.44
79 86 15.2 14.8 224.96 231.04 219.04
84 93 20.2 21.8 440.36 408.04 475.24
68 76 4.2 4.8 20.16 17.64 23.04
61 58 -2.8 -13.2 36.96 7.84 174.24
55 45 -8.8 -26.2 230.56 77.44 686.44
638 712 Sumas 1568.4 1701.6 2185.6
63.8 71.2

1568.4 1568.4
𝑟= = = 𝟎. 𝟖𝟏𝟑𝟑
√1701.6√2185.6 (41.2504545)(46.7504011)

Como podemos observar “r” tiene un valor positivo, quiere decir que las variables tienen una
dependencia positiva, es decir que si en entra más alta calificación tenga en matemáticas también
subirá la de física. Estos alumnos si son uno buenos candidatos al área de Físico-matemáticas.

DGETI Academia Nacional de Matemáticas 100


Probabilidad y Estadística: Aprendizajes Esenciales

Esta es la gráfica correspondiente:

CORRELACIÓN
100

80

60

40

20

0
0 20 40 60 80 100

También puedes realizar el ejercicio usando una hoja de Excel, para ello:

Revisa la siguiente lección:” Coeficiente de Correlación”,

https://www.youtube.com/watch?v=cRv_Ff315J4&t=15s

Actividades de cierre

Realiza el siguiente ejercicio para ver si existe relación entre las materias de Cálculo Diferencial e
inglés.

Alumno Cálculo Inglés


Diferencial
Alumno 1 44 100
Alumno 2 53 94
Alumno 3 66 90
Alumno 4 69 83
Alumno 5 73 80
Alumno 6 79 78
Alumno 7 81 74
Alumno 8 84 70
Alumno 9 89 68
Alumno 10 95 63

DGETI Academia Nacional de Matemáticas 101


Probabilidad y Estadística: Aprendizajes Esenciales

Ejercicios Adicionales

Ejercicio 1: Se midió el peso de 12 personas (x), y la extensión de su cintura (y). Se obtuvieron los
siguientes datos.

Determina si existe una correlación lineal entre ambas mediciones

x Peso y Cintura
80 100 80 100 8000 6400 10000
75 90
90 100
95 110
70 90
65 95
85 120
83 120
78 115
68 90
73 99
92 105
Sumas Sumas
Media

𝑟= = =

DGETI Academia Nacional de Matemáticas 102


Probabilidad y Estadística: Aprendizajes Esenciales

Gráfica

Calcula el coeficiente de correlación o relación que existen entré el peso y la medida de la cintura.

Coeficiente de correlación = ___________

Argumentación: ___________________________________________________________________

________________________________________________________________________________

Ejercicio 2: Se registraron en la tabla siguiente la edad (en años) y la conducta agresiva (medida en
una escala de cero a 10) de 10 niños.

DGETI Academia Nacional de Matemáticas 103


Probabilidad y Estadística: Aprendizajes Esenciales

Existe relación alguna entre la edad y la conducta agresiva de los niños.

𝑟= = =

Gráfica

Coeficiente de correlación = ___________

Argumentación: ____________________________________________________________________

_________________________________________________________________________________

DGETI Academia Nacional de Matemáticas 104


Probabilidad y Estadística: Aprendizajes Esenciales

5.2 Recta de regresión

Introducción

La recta de regresión intenta sustituir a todo un conjunto de puntos de un diagrama de dispersión y


facilitar los cálculos necesarios para determinar la tendencia que presentan las dos variables de interés.
No siempre se puede trazar dicha recta de regresión para determinar la tendencia. Esta recta también
nos sirve para extrapolar y conocer datos de que no se encuentran en la tabla de información.

Actividades de Apertura

Revisa la siguiente lección: “Recta de Regresión


Lineal”,
https://www.youtube.com/watch?v=9U-cCKW-
gDA&t=12s

Actividades de Desarrollo

Es hora de calcular la recta de regresión lineal de un conjunto de datos.


Sea la ecuación de la recta

y= bx+a+ €
Donde:
b= Es la pendiente de la recta, este valor debe estimarse a partir de la tendencia de los puntos
a= Es la ordenada al origen, es decir, el punto en que la recta cruza el eje Y
y= Es la variable dependiente
x= Es la variable independiente
€ es el error
𝑪𝑶𝑽𝒙𝒚
𝒃= donde Sx es la Varianza de x
𝑺𝒙

̅ − 𝒃𝒙
𝒂=𝒚 ̅ ̅ es la media de la variable y, 𝒙
donde 𝒚 ̅ es la media de la variable x

DGETI Academia Nacional de Matemáticas 105


Probabilidad y Estadística: Aprendizajes Esenciales

∑𝑛1(𝑥𝑖 − 𝑥̅ ) (𝑦𝑖 − 𝑦̅) ∑𝑛1(𝑥𝑖 − 𝑥̅ )2


𝐶𝑂𝑉𝑥𝑦 = 𝑆𝑥 =
n−1 n−1
Ahora tomemos los datos de la tabla

x y
Cálculo Física
48 56 -15.8 -15.2 240.16 249.64 231.04
53 64 -10.8 -7.2 77.76 116.64 51.84
77 82 13.2 10.8 142.56 174.24 116.64
44 67 -19.8 -4.2 83.16 392.04 17.64
69 85 5.2 13.8 71.76 27.04 190.44
79 86 15.2 14.8 224.96 231.04 219.04
84 93 20.2 21.8 440.36 408.04 475.24
68 76 4.2 4.8 20.16 17.64 23.04
61 58 -2.8 -13.2 36.96 7.84 174.24
55 45 -8.8 -26.2 230.56 77.44 686.44
638 712 Sumas 1568.4 1701.6 2185.6
63.8 71.2

Vamos a sustituir los valores:

1568.4
𝐶𝑂𝑉𝑋𝑌 = = 174.266667
9
1701.6
𝑆𝑋 = = 189.066667
9
174.267
𝑏= = 092172073
189.067
𝑎 = 71.2 − (0.9217207)(63.8) = 12.394217

Entonces obtenemos la ecuación de la recta: y=0.9217x+12.3942+€

DGETI Academia Nacional de Matemáticas 106


Probabilidad y Estadística: Aprendizajes Esenciales

Actividades de cierre

Encuentra la ecuación de la Recta Lineal del ejercicio anterior.

Cálculo
Alumno Inglés
Diferencial
Alumno 1 44 100
Alumno 2 53 94
Alumno 3 66 90
Alumno 4 69 83
Alumno 5 73 80
Alumno 6 79 78
Alumno 7 81 74
Alumno 8 84 70
Alumno 9 89 68
Alumno 10 95 63

Ejercicios Adicionales

Ejercicio 1

Se midió el peso de 12 personas (x), y la extensión de su


cintura (y). Se obtuvieron los siguientes datos

Define la recta de Regresión Lineal que se aproxima a este conjunto de datos.

DGETI Academia Nacional de Matemáticas 107


Probabilidad y Estadística: Aprendizajes Esenciales

𝐶𝑂𝑉𝑋𝑌 =

𝑆𝑋 =

𝑏=

𝑎=

Por tanto, la recta queda de la siguiente forma

𝒚=

DGETI Academia Nacional de Matemáticas 108


Probabilidad y Estadística: Aprendizajes Esenciales

Ejercicio 2

Se registraron en la tabla siguiente la edad (en años) y la


conducta agresiva (medida en una escala de cero a 10) de
10 niños.

Define la recta de Regresión Lineal que se aproxima a la relación entre la edad y la conducta
de los niños.

DGETI Academia Nacional de Matemáticas 109

También podría gustarte