En la mayoría de los textos sobre Estadística pueden encontrarse las técnicas de formación
de clases. Sin embargo, por las ventajas que ofrece y su sencillez se expone a continuación
el método de OSHIMURA para datos medibles (material continuo):
Método de OSHIMURA
1. Definir la cantidad total de datos: n
2. De ellos, encontrar el mayor valor (xmáx) y el menor (xmín)
3. Encontrar la mínima unidad digital: a
Ejemplos:
De: 14 17 12 10 9 15… a=1
De: 20,1 22,3 18,0 25,5 25,7… a=0,1
De: 3,82 5,27 2,00 3,59…. a=0,01
De: 300 500 400 700 200 a=100
4. Calcular el valor k, donde:
x máx x mín
k +1
a
5. Calcular la amplitud provisional de los intervalos de clase: c’, donde:
k
c’= Parte entera de a
n
6. Decidir la amplitud definitiva de los intervalos de clase: c, por cualquiera de los
siguientes criterios:
- Si es factible, tomar c=c’
- Tomar c como el valor más cercano a c’ en las series decimales del 1,2 ó 5.
Ellas son:
…0,001, 0,01, 0,1, 1, 10, 100.....
…0,002, 0,02, 0,2, 2, 20, 200....
…0,005, 0,05, 0,5, 5, 50, 500.....
7. Calcular el límite inferior del primer intervalo de clase CL como:
a
CL= Xmín -
2
8. Se calcularán entonces el límite superior del primer intervalo como (CL+c), que a su vez
coincide con el límite inferior del segundo intervalo de clase. El resto de los límites
teniendo en cuenta el valor de c serán calculados de la misma forma, esto es:
Intervalos
(CL~CL+c)
(CL+c ~CL+2c)
(CL+2c ~CL+3c)
Se construirán intervalos hasta que quede incluido el mayor valor (Xmáx) definido en el
2do. paso. Con esto quedarán constituidas todas las clases.
A continuación se procedería a construir la Tabla de la Distribución Empírica de
Frecuencias en la que se clasificarían los datos por clase y se determinarían las
frecuencias: absolutas, relativas, absolutas acumulativas y relativas acumulativas,
así como las marcas de clase y todo lo necesario para el cálculo de las medidas
de tendencia central y de dispersión de dicha distribución empírica y sus gráficos.
A partir de la Tabla construida pueden ser calculados los valores de la media y la
desviación estándar por el método codificado mediante las siguientes
expresiones:
x x0 c
x n i i
( xi ni ) 2
x ni
2
i
s c n
n 1
Se pueden construir fácilmente los gráficos estadísticos, particularmente los
Histogramas de frecuencias cuya principal utilidad radica en permitirnos obtener
una visión de la distribución a que mejor se ajustan los datos obtenidos y
procesados.
Casos conceptuales:
1.-La tabla muestra los datos originales correspondientes a la medición de la
resistencia eléctrica de 100 bobinas.
3.37 3.34 3.38 3.32 3.33 3.28 3.34 3.31 3.33 3.34
3.29 3.36 3.30 3.31 3.33 3.34 3.34 3.36 3.39 3.34
3.35 3.36 3.30 3.32 3.33 3.35 3.35 3.34 3.32 3.38
3.32 3.37 3.34 3.38 3.36 3.37 3.36 3.31 3.33 3.30
3.35 3.33 3.38 3.37 3.44 3.32 3.36 3.32 3.29 3.35
3.38 3.39 3.34 3.32 3.30 3.39 3.36 3.40 3.32 3.33
3.29 3.41 3.27 3.36 3.41 3.37 3.36 3.37 3.33 3.36
3.31 3.33 3.35 3.34 3.35 3.34 3.31 3.36 3.37 3.35
3.40 3.35 3.37 3.32 3.35 3.36 3.38 3.35 3.31 3.34
3.35 3.36 3.39 3.31 3.31 3.30 3.35 3.33 3.35 3.31
a. Decida el número de clases.
b. Calcule el intervalo de clase aproximado.
c. Construya las clases indicando los extremos de las mismas.
d. Construya un histograma por datos agrupados.
2. La gerencia del Hotel Fiesta está realizando una investigación sobre atención a
clientes en la que ha decidido incluir el tiempo de estancia de las personas que
acuden a su restaurant tipo “mesa italia”. Los tiempos (en minutos) medidos a 16
personas son:
73,8 73,2 72,4 73,7
72,8 72,9 72,6 73,2
74,5 73,4 74,2 72,5
73,3 74,4 72,7 73,6
a) ¿Estos datos pueden considerarse “información bruta”?
b) ¿Cómo pudieran ser organizados o “arreglados” estos datos?
c) Realice un arreglo formando la distribución empírica de frecuencias, calcule la
media y la desviación estándar e interprete estos resultados.
d) Construya un histograma de frecuencias.
No. Intervalo de clase Marcas Frecuencia Frecuencia Puntos Frecuencia
(ni) relativa (fi) medios(yi) acumulada(Ni)
1 (72.35-72.85) HI 5 0.3125 72.6 5
2 (72.85-73.35) III 3 0.1875 73.1 8
3 (73.35-73.85) HI 5 0.3125 73.6 13
4 (73.85-74.35) I 1 0.625 74.1 14
5 74.35-74.85) II 2 0.125 74.6 16
N= 16 = 1.0
Frecuencia Valor (Xi). (ni) (X2i) (X2i). (ni)
absoluta(Fi) característico (Xi)
0.3125 -2 -10 4 20
0.5 -1 -3 1 3
0.8125 0 0 0 0
0.875 1 1 1 1
1.00 2 4 4 8
= 0 = -8 = 10 = 32
3.- El director de mercadotecnia de una gran empresa recibe un informe mensual sobre la
actividad de ventas de uno de los productos de la empresa. El informe es un listado de las
ventas del producto por países durante el mes anterior. ¿Es este un ejemplo de datos brutos?
4. El gerente de producción de una empresa recibe un informe mensual de la sección de
control de calidad. El informe contiene la tasa de unidades rechazadas en cada línea de
producción (el número de unidades rechazadas por cada 100 que se producen), la
máquina que causa el mayor número de ellos y el costo promedio de reparar las
unidades rechazadas ¿Es este un ejemplo de datos brutos?
5. A continuación se describen las edades de 30 personas que compraron cassettes de un
grupo de rock en un día durante la Feria de San Francisco:
24 39 38 21 16 44 34 66 32 35
19 33 13 25 44 46 57 60 31 40
23 27 43 44 32 56 52 61 30 20
a) Con sólo observar los datos tal como están ¿Qué conclusiones puede extraer
rápidamente sobre el mercado de la Feria?
b) Construya una distribución de frecuencias ¿Qué conclusiones adicionales de
mercado es posible sacar ahora?
5.-Los siguientes datos corresponden al tiempo entre fallos de un artículo
reparable (h). A partir de ellos:
a) Construya la distribución empírica de frecuencias utilizando el Método de
Oshimura.
b) Calcule el tiempo medio entre fallos.
c) Construya su histograma de frecuencias.
25 42 70 52 28 37 31 28
40 26 20 51 37 35 29 35
26 30 51 40 42 29 45 60
22 28 45 65 55 50 37 23
7 23 20 35 58 22 47 28
25 32 41 25 26 31 27 42
27 37 45 28 30 37 29 48