INSTITUTO TECNOLOGICO DE LÁZARO CÁRDENAS
PORTAFOLIO DE EVIDENCIAS UNIDAD 1
INTRODUCCION A LA ESTADISTICA INFERENCIAL
MATERIA
ESTADISTICA INFERENCIAL
ALUMNA
AIDA GUADALUPE ZEPEDA CRUZ
PROFESOR
ISAAC VAZQUEZ ESQUEDA
GRUPO
41G
1. INTRODUCCION A LA ESTADÍSTICA INFERENCIAL
La estadística inferencial es una rama de la estadística que se encarga de
estudiar una población a partir de una muestra de datos. Su objetivo es extraer
conclusiones y hacer deducciones sobre la población a partir de la información
de la muestra, basándose en pruebas estadísticas y modelos de probabilidad.
En la estadística inferencial se pueden tener un margen de error debido a que
son el resultado de cálculos probabilísticos. Utilizando diferentes métodos como,
estimación de parámetros, contraste de hipótesis, intervalos de confianza,
distribución de probabilidad.
1.1 BREVE HISTORIA DE LA ESTADÍSTICA
1. Antigüedad: Egipcios, babilonios, chinos y romanos llevaban registros
censales para la administración de impuestos y la planificación económica.
2. Edad Media: Se usaban datos estadísticos para la administración feudal y el
comercio.
3. Siglo XVII: Surgió la estadística moderna con John Graunt y William Petty,
quienes aplicaron métodos cuantitativos al estudio de la población y la
economía (estadística demográfica).
4. Siglo XVIII: Jacob Bernoulli y Thomas Bayes introdujeron conceptos de
probabilidad, fundamentales en la estadística moderna.
5. Siglo XIX: Adolphe Quetelet y Francis Galton aplicaron la estadística en las
ciencias sociales y la biología, desarrollando conceptos como la regresión y
la correlación.
6. Siglo XX: Se consolidó como disciplina matemática con figuras como Karl
Pearson y Ronald Fisher, quienes desarrollaron herramientas como el
análisis de varianza y la inferencia estadística.
7. Actualidad: La estadística es esencial en la ciencia de datos, inteligencia
artificial, economía y muchas otras áreas, con el uso de software avanzado
y big data.
1.2 CONCEPTO DE ESTADISTICA
➢ La estadística es una diciplina científica formal y deductiva, a menudo
considerada rama de las matemáticas, que estudia la variabilidad y las
leyes de la probabilidad, a través de herramientas diversas, tanto
conceptuales como de muestreo. Para recolectar información de la
realidad y organizarla, contextualizarla y clasificarla para poder obtener
conclusiones viables, expresadas matemáticamente.
3 CONCEPTOS DE ESTADISTICA DE DIFERENTES AUTORES
➢ La estadística es la rama de las matemáticas que examina las formas de
procesar y analizar datos. Ofrece los procedimientos para recolectar y
transformar los datos de manera que sean útiles a quienes toman
decisiones en los negocios. La estadística se divide en dos ramas ambas
aplicables en la administración de negocios las cuales son: descriptiva y
inferencial.
➢ La estadística es el arte y la ciencia de reunir datos analizarlos,
presentarlos e interpretarlos. Especialmente en los negocios y en la
economía, la información.
➢ La estadística analiza, presenta, recolecta e interpreta datos.
La estadística contempla cuatro niveles de medición de datos, conocidos como
escalas de medición estadística, que son:
• Nominal que describe variables cuya diferencia entre si radica más en la
cualidad que en la cantidad.
• Ordinal que describe variables sobres un continuo en el que sus valores
pueden ordenarse, o sea, asignar una jerarquía o un orden a los datos.
• Intervalar que describe variables cuyos valores establecen intervalos
reconocibles.
• Racional que describe variables con intervalos iguales y que permiten
situar unos cero absolutos, de modo tal que represente la ausencia de
características.
1.3 ESTADISTICA DESCRIPTIVAS
Es la técnica matemática que obtiene, organiza, presenta y describe un conjunto de
datos con el propósito de facilitar el uso, generalmente con el apoyo de tablas,
medidas numéricas o gráficas, en la etapa donde el investigador necesita procesar
y analizar los datos recolectados en dicho estudio. Es el sentido de contar
sustantivos contables. Su objetivo principal es describir y analizar un conjunto de
datos sin hacer inferencias o predicciones sobre poblaciones más grandes. Es una
herramienta esencial para obtener una visión general y organizada de la
información.
Puede decirse que la estadística descriptiva trata fundamentalmente la presentación
de datos en forma de tablas y graficas. El cálculo de parámetros definidores y
transcriptores de muchas de las características de la población estudia. Se entiende
como el resumen de datos o análisis de datos.
1. Recopilación de datos:
o Implica obtener información de una muestra o población, ya sea a través
de encuestas, experimentos o registros.
2. Organización de datos:
o Se utilizan tablas, gráficos y diagramas para estructurar los datos de
manera que sean fáciles de interpretar.
3. Medidas de centralización:
o Representa un resumen de la colección de números.
▪ Media truncada: Para una colección finita de elementos se llama
media truncada de
orden:
Mediana muestral : Dada una colección finita de elementos la mediana muestral
es el valor
central, entendiendo como tal el valor si n es impar y M =
si n es par.
Moda: Valor o valores que aparecen con mayor frecuencia.
4. Medidas de dispersión:
o Indican cómo se distribuyen los datos alrededor de la tendencia central.
▪ Rango: Diferencia entre el valor máximo y el mínimo.
▪ Varianza: Mide la variabilidad de los datos.
▪ Desviación estándar: Raíz cuadrada de la varianza, indica la
dispersión promedio respecto a la media.
5. Representación gráfica:
o Se utilizan gráficos para visualizar los datos de manera intuitiva.
▪ Histogramas.
▪ Gráficos de barras.
▪ Diagramas de caja y bigotes.
▪ Polígonos de frecuencias.
1.4 ESTADISTICA INFERENCIAL
Se llama estadística inferencial o inferencia estadística a la rama de la
estadística encargada de hacer deducciones, es decir, inferir propiedades,
conclusiones y tendencias, a partir de una muestra del conjunto. Su papel es
interpretar, hacer proyecciones y comparaciones. Es sumamente útil en el
análisis de poblaciones y tendencias, para hacerse una idea posible de las
acciones y reacciones de la misma de cara a condiciones específicas. Esto no
significa que se las pueda predecir fielmente, ni que estemos en presencia de
una ciencia exacta, pero si de una aproximación posible al resultado final.
1. Estimación de parámetro:
Se usa una muestra para estimar valores desconocidos de una
población.
• Estimación puntual: Proporciona un único valor como mejor
estimación del parámetro poblacional.
• Estimación por intervalo (Intervalo de confianza):
Determina un rango de valores dentro del cual es probable que
se encuentre el parámetro poblacional
2. Pruebas de hipótesis
• Se formulan suposiciones sobre una población y se evalúan
mediante datos muestrales.
Hipótesis nula (H0H_0H0): Afirma que no hay diferencia o
efecto significativo.
• Hipótesis alternativa (H1H_1H1): Indica que existe una
diferencia o efecto significativo.
• Se utilizan pruebas estadísticas (como t de Student, chi-
cuadrado, ANOVA) para aceptar o rechazar la hipótesis nula.
3. Regresión y correlación
• Regresión: Modela la relación entre variables y permite hacer
predicciones.
• Correlación: Mide la intensidad y dirección de la relación entre
dos variables.
4. Análisis de varianza (ANOVA)
➢ Compara medias de múltiples grupos para determinar si existen
diferencias significativas entre ellos.
1.5 BREVE INTRODUCCION A LA INFERENCIA
ESTADISTICA
Es la rama de la estadística que permite extraer conclusiones sobre una población
a partir de una muestra de datos. Utiliza métodos probabilísticos para estimar
parámetros desconocidos y evaluar hipótesis con cierto margen de error.
Sus principales técnicas incluyen la estimación de parámetros, las pruebas de
hipótesis, el análisis de regresión y el análisis de varianza (ANOVA). Se aplica en
diversas áreas como la economía, la medicina y la investigación científica,
permitiendo tomar decisiones fundamentadas en datos.
1.6 TEORIA DE DECISION EN ESTADISTICA
Es la ciencia que estudia como tomar decisiones optimas en situaciones de
incertidumbre. En el análisis estadístico, esta teoría ayuda los riesgos y beneficios
de cada decisión.
El cual el objetivo es proporcionar una metodología para analizar adecuadamente
la información con la que se cuenta y decidir de manera razonable sobre la mejor
forma de actuar.
Elementos clave:
• Espacio de decisiones: Conjunto de opciones disponibles.
• Estados de la naturaleza: Posibles escenarios desconocidos.
• Matriz de pagos: Representa ganancias o pérdidas según la decisión
tomada.
• Reglas de decisión: Métodos como minimax, máxima verosimilitud y criterio
de Bayes para elegir la mejor opción.
1.7 COMPONENTES DE UNA INVESTIGACIÓN
ESTADISTICA
Una investigación estadística sigue una estructura específica para recolectar,
analizar e interpretar datos con el fin de responder preguntas o validar hipótesis.
Sus principales componentes son:
1. Planteamiento del problema
o Define la pregunta de investigación y su importancia.
o Ejemplo: ¿Cuál es la relación entre el ejercicio y el nivel de colesterol
en adultos?
2. Población y muestra
o Población: Conjunto total de elementos a estudiar.
o Muestra: Subconjunto representativo de la población, seleccionado
mediante técnicas como muestreo aleatorio o estratificado.
3. Variables y tipos de datos
o Variables: Características que se medirán (ejemplo: edad, peso, nivel
de colesterol).
o Datos cualitativos: Categóricos (ejemplo: género, tipo de ejercicio).
o Datos cuantitativos: Numéricos (ejemplo: altura, nivel de colesterol).
4. Recolección de datos
o Uso de encuestas, experimentos, observaciones o bases de datos.
5. Organización y presentación de datos
o Tablas de frecuencias, gráficos de barras, histogramas, diagramas de
dispersión, entre otros.
6. Análisis estadístico
o Estadística descriptiva: Media, mediana, moda, desviación
estándar, etc.
o Estadística inferencial: Pruebas de hipótesis, regresión, análisis de
varianza.
7. Interpretación de resultados
o Explicación de los hallazgos y su relación con la hipótesis.
8. Conclusiones y recomendaciones
o Resumen de los resultados y sugerencias para futuras
investigaciones.
9. Referencias y bibliografía
o Citas de estudios previos y metodologías utilizadas.
1.8 RECOLECCIÓN DE DATOS
La recolección de datos es el proceso de obtener información para su análisis en
una investigación estadística. Es fundamental para garantizar la validez y
confiabilidad de los resultados.
METODOS DE DATOS:
1. Encuestas y cuestionarios
o Se aplican preguntas estructuradas a una muestra de la población.
o Pueden ser presenciales, telefónicas o en línea.
2. Observación directa
o Se registran datos sin intervención del investigador.
o Útil en estudios de comportamiento o fenómenos naturales.
3. Experimentos
o Se manipulan variables en un entorno controlado para medir su efecto.
o Ejemplo: Ensayos clínicos para probar medicamentos.
4. Registros y bases de datos
o Se utilizan datos históricos o administrativos, como censos o reportes
financieros.
5. Entrevistas
o Se obtiene información mediante preguntas abiertas o estructuradas.
6. Muestreo de sensores y dispositivos
o Se emplean herramientas tecnológicas como sensores de
temperatura o dispositivos médicos.
TIPOS DE DATOS
• Datos cualitativos: Describen características o categorías (género, color de
ojos).
• Datos cuantitativos: Son numéricos y medibles (edad, ingresos,
temperatura).
1.9 ESTADÍSTICA PARAMETRICA (POBLACIÓN Y
MUESTRA ALEATORIA)
Es un enfoque en el que se supone que los datos siguen una distribución
específica, como la distribución normal, y se utilizan parámetros de esa
distribución para hacer inferencias sobre la población. En este tipo de
estadística, se realiza un análisis basándose en la población y la muestra
aleatoria, asumiendo que los datos cumplen con ciertas condiciones.
1. Población
o La población es el conjunto completo de elementos que se desea
estudiar o analizar.
o Puede ser finita o infinita, dependiendo del contexto de la
investigación.
o Ejemplo: Todos los estudiantes de una universidad o todos los
productos fabricados en una planta.
2. Muestra Aleatoria
o Es un subconjunto representativo de la población, seleccionado de
manera que todos los elementos de la población tengan la misma
probabilidad de ser elegidos.
o El muestreo aleatorio es crucial para garantizar que la muestra sea
representativa y que los resultados sean generalizables a la población.
o Ejemplo: Seleccionar aleatoriamente 100 estudiantes de una
universidad para un estudio.
3. Parámetros y Estimadores
o Parámetros: Son valores que describen una característica de la
población (como la media μ\mu, la desviación estándar σ\sigma o la
varianza).
o Estimadores: Son valores calculados a partir de la muestra que se
usan para estimar los parámetros de la población.
▪ Ejemplo: La media muestral es un estimador de la media
poblacional (μ\mu).
4. Distribuciones de Probabilidad
o En estadística paramétrica, se asume que los datos siguen una
distribución específica, generalmente una distribución normal.
o Se utilizan distribuciones como la normal, t de Student, chi-
cuadrado, y F para hacer inferencias sobre los parámetros de la
población.
5. Pruebas de Hipótesis
o Se utilizan para probar si una hipótesis sobre un parámetro
poblacional es verdadera o falsa, basándose en los datos de la
muestra.
o Ejemplo: Probar si la media de una población es igual a un valor
específico utilizando una prueba t de Student.
6. Intervalos de Confianza
o En estadística paramétrica, los intervalos de confianza se calculan
para estimar un parámetro poblacional con un cierto nivel de certeza.
o Ejemplo: Estimar el rango en el que se encuentra la media de la
población con un 95% de confianza.
1.10 APLICACIONES
• Investigación médica: Evaluar la efectividad de un tratamiento o
medicamento en una población de pacientes.
• Psicología: Estudiar la relación entre variables psicológicas y de
comportamiento.
• Economía: Analizar el impacto de políticas económicas sobre el crecimiento
de un país.
• Ingeniería: Estimar las propiedades de materiales a partir de una muestra.
TAMAÑO DE LA MUESTRA
• Permite saber cuantos individuos necesarios estudiar, para poder estimar un
parámetro determinado con el grado de confianza deseado, o el numero
necesario para poder detectar una determinada diferencia entre los grupos
de estudio, suponiendo que existiese realmente.
• Formula
EJERCICIOS