1.
Estadística descriptiva
Población: todos los elementos ( pueden ser personas o artículos de interés en un estudio)
Muestra: subconjunto que interesa que sea representativo en la población.
En bioestadística se tiene unos conceptos bases:
1. Estadística descriptiva:
Media muestral
Varianza muestral
-Después de tener los datos, se saca una muestra aleatoria y se empieza a
analizar( estadísticos)
2. Estadística inferencial:
Media poblacional
Varianza poblacional
-Sitio y tiempo donde se está tomando la descripción del estudio.
-A través de los datos arrojados en la muestra infiere los datos relacionado (infiere el
comportamiento de la población a través de parámetros)
Clasificación de las variables:
Cualitativas: son aquellas que expresan cualidades o atributos del objeto de
estudio
Ej. Género, estado civil, escolaridad, estrato socioeconómico.
Escalas
Nominal: solo permite asignar un nombre al elemento medido y no requiere orden.
Ejemplo: femenino/masculino
Ordinal: permite establecer un orden entre los elementos medidos
Ejemplo: nivel de satisfacción de un producto (excelente, bueno, regular, malo)
Análisis de datos cualitativos:
Se genera una tabla de frecuencias
Ej.
-ni: número de observaciones de cada clase
-fi: división de cada una de las frecuencias absolutas sobre el total de los datos observados
Gráficos:
Diagrama circular
Diagrama de barras
Ej.
Cuantitativas: miden las características de un objeto de estudio
Discretas: son variables, enteras, contables
Ejemplo: personas, artículos, edad, etc..
Son variables puntuales.
Continuas: son variables medibles.
Ejemplo: estatura, edad, salario, peso, temperatura, índice de masa corporal, etc..
Son variables no puntuales
Dato: se busca tener un solo valor que representa los datos
Escalas
Razón: la diferencia entre las mediciones tiene sentido y el 0=ausencia de la
variable.
-se pueden hacer razones entre ellas (el doble, el triple, el cuádruple, etc..)
Ej. Edad entre [10-20] (20-30]
Sentido lógico comprarlo, (yo peso 25 y otra persona 50)
Intervalo: número de escala es igual y el punto 0=no indica ausencia
-mide magnitud.
Ej. Talla de vestir (0, 2, 4, 6)/ Temperatura= 0 grados
Se necesitan dos variables para obtenerla
Análisis de datos cuantitativas:
Se genera una tabla de frecuencia.
Ej.
Gráficos:
Histograma: muestra el comportamiento continuo de una variable
Las barras no están separadas
Se agrupan en clases para obtener una distribución de frecuencia donde se puedan
observar también las frecuencias absolutas y relativas del conjunto de datos.
Ej. Histograma para la edad
Tipos de pregunta:
Preguntas abiertas
Preguntas dicotomías
Preguntas de selección múltiple con única respuesta.
Preguntas de selección múltiple con múltiple respuesta.
2. Medidas de tendencia central
Son las medidas de tendencia central las que ayudan a obtener este valor
Para el cálculo de la mediana y cuando los datos son impares: se tiene que ordenar
los datos y luego se busca el resultado que se obtenga.
Ej. En el caso del ejemplo está en la posición 5 y se puede interpretar de dos maneras: el
50% de los empleados en la muestra tiene 27 años o menos o el 50% de los empleados en la
muestra tiene 27 años o más.
La moda se usa especialmente en datos de escala nominal.
1. Tabla dinámica
2. Selecciona toda la tabla con títulos
3. Aceptar
1. Mostrar bien los valores con el total completo:
2. Clic derecho: configuración de campo de valor
3. Recuento
4. Aceptar
1. Se cambian los valores por los nombres que corresponde
1. Para ponerlo por posentage por fila:
2. Clic derecho: configuración de campo de valor
3. Mostrar datos como
4. % de total de filas
5. Aceptar
6. Para ponerlo por posentage por columna:
7. Clic derecho: configuración de campo de valor
8. Mostrar datos como
9. % de total de columnas
10. Aceptar
Ruta análisis exploratorio de datos