DISTRIBUCIÓN DE FRECUENCIAS


Las tablas de distribución de frecuencias se utilizan cuando se recolectan datos, con ellas se pueden representar los datos de manera que es más fácil analizarlos.

 

Se pueden elaborar tablas de distribución de frecuencias para datos no agrupados y para datos agrupados. Estas últimas se utiliza cuando se tienen muchos datos.

 

Para elaborar tablas de distribuciones de frecuencia se debe tener en cuenta lo siguiente:

Cuando hay muchos datos se agrupan en clases. Esto consiste en agrupar los datos en una distribución de frecuencias, que puede definirse como una ordenación o arreglo de datos en clases o categorías que muestran para cada una de ellas, el número de elementos que contiene, denominada frecuencia.

 

Clase es cada uno de los grupos en que se dividen los datos. Para determinar cuántas clases crear, se puede utilizar la siguiente fórmula (fórmula de Sturges)

 

     Número de clases = 1 + 3,322 log n          donde n es el número total de datos.

 

Si al aplicar la fórmula se obtiene un número decimal, se aproxima al siguiente entero.

 

El intervalo de clase o el ancho de la clase (tamaño de la clase) es el espacio que hay entre el límite superior y el límite inferior de la clase, los cuales corresponden a los valores extremos de la clase. Para obtener el ancho de clase se utiliza la siguiente fórmula:

 

                Ancho de clase = (dato superior – dato inferior)/ número de clases

 

La frecuencia absoluta es el número de veces que se repite cada dato. Cuando se agrupan los datos, es el número de datos que tiene cada clase. Se simboliza con fj.

 

La marca de clase es el punto medio de la clase. Se obtiene dividiendo entre dos la suma de los valores extremos de cada clase.

 

El rango es la diferencia entre el valor mayor y el valor menor en estudio de una distribución de datos.

 

La frecuencia absoluta acumulada es la frecuencia total hasta el límite superior de cada clase. Se simboliza con  F i.

 

La frecuencia relativa de un dato da información sobre qué parte de la población o de la muestra en estudio corresponde a la característica analizada. Se obtiene dividiendo la frecuencia absoluta entre el número total de datos y se puede expresar como una fracción, como un decimal o como un porcentaje. Se simboliza con f i / n donde n es el número de datos.

 

La frecuencia acumulada relativa es la frecuencia relativa total hasta el límite superior de cada clase. Se simboliza con F j / n donde n es el número total de datos.

 

Límites de clase

Los límites de clase son los valores que separan a una clase en particular de la anterior y de la siguiente.

  

Las clases de la distribución pueden escribirse en forma de límites indicados o de límites reales.  Así por ejemplo si se tiene la siguiente tabla referente a la estatura de 50 obreros en pulgadas:

Clases

Frecuencias

 

50,5 - 53,5

 

1

53,5 - 56,5

2

56,5 – 59,5

6

59,5 – 62,5

11

62,5 – 65,5

16

65,5 – 68,5

9

68,5 – 71,5

4

71,5 – 74,5

1

 

TOTAL

 

50

En el ejemplo anterior los límites indicados son 51 – 53, 54 – 56, etc. y los límites reales son: 50,5 – 53,5; 53,5 – 56,5; etc.

 

Es importante saber establecer los límites reales, pues con base en ellos se calcula el punto medio, magnitud que se usará para cálculos posteriores.

 

No hay ningún problema en establecer límites reales en variables discretas, pues en este caso los límites dados y los reales coinciden, pero si lo hay cuando se trata de una variable continua.  Por ejemplo, las observaciones que están entre dos límites indicados, ¿dónde se clasifican?, ¿cómo interfiere el modo de redondeo de los datos?

 

 Para ilustrar considérese una distribución de frecuencias de personas según edad, en años, con los siguientes límites indicados: 10 – 14, 15 – 19, 20 – 24, etc. ¿Cuáles son los límites reales de esta distribución?

 

Límites reales para cada tipo de redondeo

LÍMITES

INDICADOS

MÉTODO USUAL

(Cumpleaños

más cercano)

HACIA ABAJO

 

(Edad cumplida)

HACIA ARRIBA

 

(Próximo cumpleaños)

10 – 14

9,5 – 14,5

10 a menos de 15

más de 9 a 14

15 – 19

14,5 – 19,5

15 a menos de 20

más de 14 a 19

20 – 24

19,5 – 24,5

20 a menos de 25

más de 19 a 24

etc.

etc.

etc.

etc.

 

 

Ejemplo:

Suponga que un investigador desea determinar cómo varía el peso de un grupo de estudiantes de primer semestre de una universidad. Selecciona una muestra de 50 estudiantes y registra sus pesos en kilogramos. Los datos obtenidos fueron los siguientes:

 

65          63           65           63           69           67           53           58           60           61

64          65           64           72           68           66           55           57           60           62

64          65           64           71           68           66           56           59           61           62

63          65           63           70           67           66           57           59           61           62

64          64           63           69           67           66           58           60           61           62

 

Este diagrama facilita determinar la cantidad de veces que se repite un dato y los valores de los datos con el fin de escribirlos de manera ordenada en la tabla.

 

 Para construir la tabla de datos no agrupados se debe calcular primero lo siguiente:

 

Número de clases

\[\begin{align*} k&=1+3,322log\left ( n \right )\\ &= 1+3,322log\left ( 50 \right )\\ &=6,64\approx 7 \end{align*}\]

Rango

\[R = x_{n} - x_{1} = 72 - 53 = 19\]

Amplitud de clase

\[\begin{align*} I&=\frac{R}{k}\\ &= \frac{19}{7}\\ &=2,71\approx 3 \end{align*}\]

Punto medio: mi es el valor central de la clase.  Se obtiene calculando el promedio de los límites reales, sumando al límite real inferior el límite real superior y dividiendo por dos.

 

Frecuencia absoluta.  Se define como el número de elementos u observaciones pertenecientes a una misma clase.

 

Frecuencia relativa:  Se obtiene dividiendo la frecuencia absoluta por el número total de observaciones.  Indica la importancia relativa de la clase.

 

Frecuencias acumuladas:  Es la suma de las frecuencias absolutas o relativas en sentido ascendente o descendente según se quieran acumular “hacia arriba” o “hacia abajo”

Al construir la tabla de datos agrupados con la información del ejemplo, se tiene:

Tabla de datos agrupados

 

 

 

Punto

medio

 

Frecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuencia relativa acumulada

Pesos (Kg)

mi

f i

F i

fr i

Fr i

53 - 55

54

2

2

4,00%

4,00%

56 - 58

57

5

7

10,00%

14,00%

59 - 61

60

9

16

18,00%

32,00%

62 - 64

63

15

31

30,00%

62,00%

65 - 67

66

12

43

24,00%

86,00%

68 - 70

69

5

48

10,00%

96,00%

71 - 73

72

2

50

4,00%

100,00%

 

 

50

 

100,00%