0% encontró este documento útil (0 votos)
17 vistas15 páginas

Descripcion Del Tif

Este documento describe el trabajo integrador final de un curso de probabilidad y estadística. El objetivo del trabajo es demostrar las competencias adquiridas durante el curso a través de un estudio estadístico y probabilístico que incluya conceptos, procesos, recolección y análisis de datos, y el uso de tecnología de la información. El documento también proporciona detalles sobre cómo desarrollar y presentar el trabajo final.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
17 vistas15 páginas

Descripcion Del Tif

Este documento describe el trabajo integrador final de un curso de probabilidad y estadística. El objetivo del trabajo es demostrar las competencias adquiridas durante el curso a través de un estudio estadístico y probabilístico que incluya conceptos, procesos, recolección y análisis de datos, y el uso de tecnología de la información. El documento también proporciona detalles sobre cómo desarrollar y presentar el trabajo final.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 15

Trabajo integrador final

Probabilidad y estadística

Profe: Salazar Gustavo


Alumna: Santillán Daiana
D.N.I: 42.864.569
Curso: 3er año
Año: 2021
DESCRIPCION DEL TIF

El trabajo de integración final tiene como objetivo resaltar el trabajo realizado y las competencias
adquiridas, tanto desde lo presencial como en lo virtual, por esta razón se pide la realización de lo
siguiente:

Realizar un estudio estadístico y probabilístico teniendo en cuenta los contenidos, la trayectoria


en la cátedra, tanto en lo presencial como en lo virtual, asimismo, los puntos notables abajo
expuesto

 Conceptos abordados
 Procesos estadísticos y probabilísticos básicos
 Recolección y tratamiento de datos
 Tablas de distribución de frecuencias
 Calculo de medidas
 Uso de las TICs
 Organización del trabajo matemático
 Reflexión y conclusiones

En base a lo teórico-práctico desarrollado, deben realizar ejemplos del trabajo matemático


realizado en clase, teniendo en cuenta los lineamientos anteriores.

Para su presentación se permite la utilización de los siguientes programas informáticos:

 Word Office
 Power Point
 PDF
 Material audiovisual (Movie Maker o cualquier otro editor de video)

DESARROLLO

ESTADÍSTICA

Es el conjunto de métodos y procedimientos que implican recopilación, presentación, ordenación


y análisis de datos, con el fin que a partir de ellos puedan inferirse conclusiones.

Estadística Descriptiva: Es la que se utiliza en la descripción y análisis de conjuntos de datos o


población.

Inferencia Estadística: La cual hace posible la estimación de una característica de una población, o
la toma de una decisión con respecto a una población, con base únicamente en resultados
muéstrales.

CONCEPTOS DE ELEMENTOS UTILIZADOS EN EL ANÁLISIS ESTADÍSTICO

Población o Universo: conjunto completo de individuos, objetos o medidas los cuales poseen una
característica común observable y que serán considerados en un estudio.

Muestra: es un subconjunto o una porción de la población.


Variable: característica o fenómeno de una población o muestra que será estudiada con la cual
puede tomar diferentes valores.

Datos: números o medidas que han sido recopiladas como resultado de la observación.

Estadístico: es una medida, un valor que se calcula para describir una característica a partir de una
sola muestra.

Parámetro: es una característica cuantificable de una población.

Variables: Es muy probable que un especialista en estadística qué es realiza una encuesta de se
desarrollará un instrumento que le permita hacer varias preguntas y manejar diversos fenómenos
o características. a estos fenómenos o características se les denomina variables aleatorias.

Según la forma en que se expresen las variables, se dividen en:

1- Variables Cualitativas: son aquellas que pueden expresarse solo en forma de atributo.

Ejemplos:

a) calificación no numérica:
 aprobado
 sobresaliente
 aceptado
 reprobado
b) color de ojos:
 negros
 marrón
 azul
 verdes
c) Tamaño de un tablero:
 Grande.
 Mediano.
 Pequeño.

2- Variables Cuantitativas: son aquellas variables que pueden expresarse en forma numérica. Se
dividen en discretas y continuas.

2.1 Variables Cuantitativas Discretas: son respuestas numéricas que surgen de un proceso de
conteo, siendo siempre un número entero.

Ejemplos:

 Números de hijos en una familia


 Cantidad de trabajadores que trabajan en una tienda
 Números de libros vendidos en el mes.

2.2 Variables Cuantitativas Continuas: son respuestas numéricas que surgen de un proceso de
medición, las cuales pueden tomar valores entre dos números enteros.
Ejemplos:

 Estatura de una persona


 El peso de una persona
 Velocidad que viaja un avión

TABULACION DE DATOS CUALITATIVOS

La construcción de una distribución de frecuencia de atributos o distribución de frecuencia de


variable cualitativa es simple, basta enumerar los diversos atributos con su respectiva frecuencia
de ocurrencia.

Frecuencia absoluta: (fi) indica el número de veces que se repite un atributo.

EJERCICIO: Pensar en animales autóctonos de la zona para ir recopilando datos.

M Animales Cantidad (fi)


1 vizcacha 3
2 conejo 3
3 quirquincho 4
4 perdiz 1
5 mulita 2
6 guazuncho 4
7 Paloma 1
8 Puma 1
9 Charata 1
10 Oso 2
hormiguero
11 iguana 2
Total 24

 Los animales son variables cuantitativas


 fi es la frecuencia absoluta
 n es el tamaño de la muestra, con lo cual corresponde la sumatoria de todas las
frecuencias. En este caso 24
 el número de fila se llama clase y se lo denota con la letra m

A) Tabulación de datos cuantitativos

Toma un conjunto pequeño de datos distintos.


Las tablas de frecuencia de variable discreta llevan cinco columnas donde los elementos que
participan son los siguientes:

Frecuencia absoluta: (fi) indica el número de veces que se repite un atributo.


b- Tamaño de la Muestra: (n) indica la cantidad de elementos que conforman la muestra, se
obtiene sumando todas las frecuencias absolutas.

n= ∑𝑚
𝑖=1 𝑓𝑖 m= número de clases distintas

c- Frecuencia Relativa: (hi) es la proporción de datos que se encuentran una clase, se obtiene
dividiendo la frecuencia absoluta de la clase por el tamaño de la muestra.
𝑓𝑖
hi= 𝑛 obs: a_∑ 𝒉𝒊 = 𝟏

b_ 0 ≤ hi ≤ 1

d- Frecuencia Absoluta Acumulada: (Fi) indica la cantidad de datos que se encuentran hasta cierta
clase.

Fi= ∑𝑖𝑗=1 𝑓𝑗

e- Frecuencia Relativa Acumulada: (Hi) es la proporción de datos acumulados que se encuentran


hasta cierta clase.

Hi=∑𝑖𝑗=1 ℎ𝑗 Obs: a_ Hm= 1

b_ 0 ≤ Hi ≤ 1

1.2 Tabulación de Variable Continua o Discreta.

Para tabular una variable continua o (que tome un gran número de datos distintos) se necesitan
los siguientes elementos:

a- Rango o Recorrido: es la diferencia entre el valor máximo y valor mínimo que toma la variable.
R= Xmax – Xmin.

b- Número de Intervalos o Clases (m): es el número de grupos en que es posible dividir los valores
de la variable.

El número de clases no debe ser ni muy grande ni muy pequeño, un número pequeño de clase
puede ocultar la naturaleza general de los datos y un número muy grande puede ser demasiado
detallado como para revelar alguna información útil. Como regla general se recomienda que el
número de clases este entre 5 y 20. Hay una regla llamada regla de Sturges que puede dar una
aproximación razonable para

el número de clases, ella es: m= 1 + 3, 3 log (n), donde n es el número de datos de la muestra.

c- Amplitud del Intervalo o Amplitud de la Clase (a):


𝒓𝒆𝒄𝒐𝒓𝒓𝒊𝒅𝒐 𝑟
a=𝒏° 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆 = 𝑚

d- Límites de un Intervalo: son los valores extremos de una clase. El menor valor es considerado
como el límite inferior y el valor que se obtiene sumando al límite inferior la amplitud del intervalo
es el límite inferior de la segunda clase.
e- Límites Reales de un Intervalo: se obtienen calculando el promedio entre el límite superior de
una clase y el límite inferior de la clase siguiente.

f- Marca de Clase: (xi), es el punto medio de un intervalo.

g- Frecuencia Absoluta: (fi), indica el número de observaciones que pertenece un intervalo dado.
Observación: n=∑𝒎𝒊=𝟏 𝒇𝒊 n= tamaño de la muestra.

h- Frecuencia Relativa: (hi) es la proporción de datos que se encuentra en un intervalo, se


determina dividiendo la frecuencia absoluta del intervalo por el tamaño de la muestra.
𝑓𝑖
hi= 𝑛

i- Frecuencia Absoluta Acumulada: (Fi), indica el número de datos de la muestra menores o


iguales al límite real superior del intervalo i.

Fi= ∑𝑖𝑗=1 𝑓𝑗 Observaciones fm = m

j- Frecuencia Relativa Acumulada: (Hi), indica la proporción de datos de la muestra menores o


iguales al límite real superior del intervalo i.

HI=∑𝑖𝑗=1 ℎ𝑗

Los siguientes datos son los puntos obtenidos por 50 estudiantes en un examen

35 50 61 69 80 35 52 64 71 81

35 53 65 73 84 39 54 65 73 85

41 55 65 74 85 41 55 66 74 88

42 57 66 76 89 45 59 66 77 91

47 48 60 68 78 97 60 67 77 94

Construir una tabla de frecuencia.

R=Xmax – Xmin K-Intervalos Amplitud

R= 97 – 33 k = 1+3,322.log n A= R/K

R= 64 K= 1+3,322.log 50 A= 64/6

K= 6 A=10,6
m Puntajes x fi fr Fi
obtenidos
1 33-43,6 38,8 7 0,14 7
2 43,6-54,12 48,8 7 0,14 14
3 54,12-64,8 59,5 7 0,14 21
4 64,8-75,4 70,1 14 0,28 35
5 75,4-86 80,1 10 0,2 45
6 56-96,6 91,3 5 0,1 50
7 total 50

Representación gráfica:

Su objetivo es captar la información obtenida en los datos en forma rápida por cualquier persona,
así cada representación debe llevar un título adecuado.

Las normas en la construcción de un gráfico estadístico son similares a los gráficos de funciones,
las variables independientes, se ubican en la sisa y las dependientes en la orden las ordenadas.

Tipos de Gráficos:

A- Gráfico Circular: se usan para mostrar el comportamiento de las frecuencias relativas como
absolutas y porcentuales de las variables. Dichas frecuencias son representadas por medio de
sectores circulares, proporcionales a las frecuencias

B- Pictograma: es un gráfico cuyo uso es similar al del sector circular, pero la frecuencia es
representada por medio de una figura o dibujo que identifique a la variable en estudio. Este
gráfico se utiliza para mostrar producciones en una serie cronológica.

Por ejemplo: alumnos del instituto profesional Dr. Virginio Gómez.


C- Gráfico Lineal: se utiliza para mostrar las frecuencias absolutas o relativas de una variable
discreta, son representadas mediante líneas verticales proporcionales a dicha frecuencias.

D- Gráfico de Barras: se utiliza para representar tablas de frecuencia con atributos o con variables
discretas y pocos valores. Sobre un eje horizontal se construyen las bases de rectángulos del
mismo ancho cada uno correspondiente a una modalidad del atributo, sobre esta base se levantan
rectángulos cuya altura es proporcional a la frecuencia absoluta de la modalidad. El espacio entre
ellas debe ser uniforme

E_ Histograma: es el gráfico adecuado cuando los datos están ordenados en Tablas con intervalos,
es decir, para datos de variables continuas. También el histograma es una conformación de
rectángulos, pero uno al lado de otro cuya área es proporcional a la de la frecuencia de cada
intervalo. Los extremos de la base de cada rectángulo son los límites reales del intervalo.
F_ Polígono de Frecuencia: este gráfico sirve para mostrar las tendencias de la variable, se puede
determinar a partir de un histograma uniendo los puntos medios Superiores de cada rectángulo
del histograma. También, se denomina el polígono uniendo los puntos formados por la marca de
clase con la frecuencia absoluta del intervalo respectivo.

Observación: El polígono de frecuencias se convierte en polígono de frecuencias relativas,


cambiando la frecuencia absoluta por la frecuencia relativa como en este caso, el área bajo el
polígono de frecuencias relativas es igual a 1.

G_ Ojiva: es un gráfico que se usa para mostrar cómo se acumulan las frecuencias absolutas
relativas o porcentuales. Se obtiene al unir los puntos formados por los límites superiores de cada
intervalo con la frecuencia absoluta o relativa acumulada del intervalo respectivo. Si se considera
las frecuencias porcentuales acumuladas se llaman ojiva porcentual.
LA MEDIA, LA MEDIANA Y LA MODA

La media, la mediana y la moda pertenecen a una clasificación de medidas en la estadística


conocida como de tendencia central y las cuales las medidas de tendencia central nos ayudan a
obtener las similitudes en los conjuntos estadísticos y agruparlos en ciertos patrones y ciertas
similitudes.

Es por estos grandes conjuntos de datos en estadística se han creado medidas de tendencia
central, que como su nombre lo indica pues podemos calcular tendencias dentro de estos
conjuntos de datos y así encontrar cuáles son las similitudes en torno a un valor central.

La media, la mediana y la moda son las cantidades más utilizadas en la probabilidad y estadística.
Pertenecen a la clasificación de medidas en estas ramas de las matemáticas.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION

En todo análisis y/o interpretación se pueden utilizar diversas medidas descriptivas que
representan las propiedades de tendencia central, dispersión y forma para extraer y resumir

las principales características de los datos. Si se calculan a partir de una muestra de datos Cómo se
les denomina estadísticos; si se le calcula a partir de una población se les denomina parámetros.

Medidas de Tendencia Central: La mayor parte de los conjuntos de datos muestran una tendencia
a agruparse alrededor de un punto "central” y por lo general es posible elegir algún valor que
describa todo el conjunto de datos. Un valor típico descriptivo como ese es una medida de
tendencia central o “posición”. Las medidas de tendencia central a estudiar son: media aritmética,
mediana y moda.

MEDIA ARITMÉTICA: También denominada media, es la medida de tendencia central que se utiliza
con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de datos,
dividiendo después ese total entre el número total de elementos involucrados.

La media aritmética de un conjunto de valores X1, X2…, Xn se define como el cociente entre la
suma de los valores y el número de ellos. Su símbolo es si la media aritmética es de una muestra y
si la media aritmética es de una población.

Media Muestral:
𝑋1+𝑋2+⋯…+𝑋𝑛 𝑥𝑖
𝑥̂ 𝑛
= ∑𝑛𝑖=1 𝑛 ; n= tamaño muestra

Media Poblacional:
𝒙𝟏+𝒙𝟐+⋯.+𝒙𝒏 𝒙𝒊
𝒖= 𝑵
= ∑𝒏𝒊=𝟏 𝑵 ; N= tamaño de la muestra

MEDIA ARITMÉTICA: También denominada media, es la medida de tendencia central que se


utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de
datos, dividiendo después ese total entre el número total de elementos involucrados.
La media aritmética de un conjunto de valores X1, X2…, Xn se define como el cociente entre la
suma de los valores y el número de ellos. Su símbolo es si la media aritmética es de una
muestra y si la media aritmética es de una población.
Media Muestral:
𝑥1+𝑥2+⋯.+𝑥𝑛 𝑥𝑖
𝑥̃ = ∑𝑛𝑖=1 ;n= tamaño de la muestra
𝑛 𝑛
Media Poblacional:
𝑥1+𝑥2+⋯.+𝑥𝑛 𝑥𝑖
𝑢 = ∑𝑛𝑖=1 ; 𝑁 = tamaño de la muestra
𝑛 𝑁
MEDIANA: Es el valor que se encuentra en el centro de una secuencia ordenada de datos. La
mediana no se ve afectada por observaciones externas en un conjunto de datos. Por ello,
cuando se presenta alguna información externa, resulta apropiado utilizar la mediana y no la
media, para describir el conjunto de datos. Su símbolo es Me.
1- Para muestra con número impar de datos:
𝑋𝑛−1
Me=
2
2- Para muestra con número par de datos:
𝑋𝑛⁄
2 +𝑋𝑛⁄2
Me= 𝑛
3- Mediana para datos agrupados:
𝑛
−𝑓𝑖−1
Me= Li+( 2 ). 𝑎
𝑓𝑖

Donde:
i= es el primer intervalo cuya frecuencia acumulada supera a n/2.
Li= es el límite real inferior del intervalo de la mediana.
n= es el número de datos.
Fi-1= es la es la frecuencia acumulada anterior al intervalo de la mediana. fi= es la frecuencia
absoluta del intervalo de la mediana. a= es la amplitud del intervalo.

MODA: es el valor de un conjunto de datos que aparece con mayor frecuencia. Se le obtiene
fácilmente a partir de un arreglo ordenado. A diferencia de la media aritmética, la moda no se
afecta ante la ocurrencia de valores extremos. sin embargo, solo se utiliza la moda para
propósitos descriptivos porque es más variable, para distintas muestras que las demás
medidas de tendencia central. Un conjunto de datos puede tener más de una moda o
ninguna. Su símbolo es Mo.
1- Moda para datos no agrupados, ejemplos:
Datos: 2,4, 5, 6, 7,7,8,7, 6. → Mo = 7
Datos: 0,1,2,3,4,5 → Mo= no existe.
2- Moda para datos agrupados: existe más de una forma de calcular la moda.

𝒅𝟏
Caso a: Mo= 𝒍𝒊 + ( ).𝒂
𝒅𝟏+𝒅𝟐
Donde:
i= es el intervalo de mayor frecuencia absoluta.
Li= es el límite real inferior del intervalo qué contiene a la moda.
d1= es la diferencia entre la frecuencia absoluta del intervalo de la moda y el intervalo
anterior: d1= fi – fi-1
d2= es la diferencia entre la frecuencia absoluta del intervalo de la moda y el intervalo
posterior: d2= fi – fi+1
a= es la amplitud del intervalo
𝒇𝒊+𝟏
Caso b: Mo= 𝒍𝒊 + ( ).𝒂
𝒇𝒊−𝟏+𝒇𝒊+𝟏
Dónde: i = es el intervalo de mayor frecuencia absoluta.

Ejercicios:

La siguiente tabla corresponde a la estructura de 80 estudiantes de una determinada carrera.

Estatura xi fi fr Fi xi.fi
1,65 – 1,69 1,67 6 0,075 6 10,02
1,70- 1,74 1,72 12 0,15 18 20,64
1,75 -1,79 1,77 30 0,375 48 53,1
1,80-1,84 1,82 22 0,275 70 40,04
1,85-1,89 1,87 8 0,1 78 14,96
1,90 -1,94 1,92 2 0,025 80 3,84

total 80 142,6
Varianza y desviación estándar
Dos medidas de dispersión que se utilizan con frecuencia y que si toman en consideración la forma
en que se distribuyen los valores son la varianza y su raíz cuadrada, la desviación estándar. Estas
medidas establecen la forma en que los valores fluctúan con respecto a la medida.

Varianza: La varianza se define como el promedio aritmético de las diferencias entre cada uno de
los valores del conjunto de datos y la media aritmética del conjunto elevadas al cuadrado.

Su símbolo es S2 si estamos trabajando con una muestra y si estamos trabajando con una
población.
¿Qué indican la Varianza y la Desviación Estándar?: La varianza y la desviación estándar miden la
dispersión “promedio” en torno a la medida aritmética, es decir, cómo fluctúan las observaciones
mayores por encima de la media aritmética y cómo se distribuyen las observaciones menores por
debajo de ella.

Criterio de Homogeneidad: Una distribución se considera homogénea, si la desviación estándar se


encuentra entre la quinta y la cuarta parte del rango. Si no es así, entonces se considera que la
muestra es heterogénea.

a- Para la muestra de datos: 25, 12, 23, 28, 17, 15

R = 28 – 12 = 16

S = 6, 26
𝑅 𝑅
( 5 ; 4 )= [3,2 ; 4,0] SɆ [3,2 ; 4,0]

Por lo tanto, la muestra es heterogénea.

EJERCICIO

Los impuestos pagados por un grupo de contribuyentes han dado origen a la siguiente tabla de
frecuencia.

Montos de impuestos Números de personas


1-20 4
21-40 15
41-60 21
61-80 18
81-10 2
60
total

Determine:

a. Desviación estándar muestral.

b. Determine si la muestra es homogénea o heterogénea.

Rta:

También podría gustarte