Tablas de frecuencia histogramas

Una de las primeras cosas que normalmente se hace con una serie grande de datos numéricos es formar algún tipo de tabla de frecuencias, donde la tabla muestra el número de veces que ocurre un suceso individual o el número de sucesos que entran en un intervalo dado. Estas distribuciones de frecuencias se pueden representar utilizando histogramas. Ilustraremos esta técnica con dos ejemplos.

EJEMPLO 1

Un edificio tiene 45 apartamentos con el siguiente número de inquilinos:

Observar que los únicos números que aparecen en la serie son 1, 2, 3, 4, 5 y 6. La distribución de frecuencias de estos números aparece en la Figura 1.2. Concretamente, en la columna 1 se indican los números que aparecen y la
columna 2 indica la frecuencia de cada número. (Estas frecuencias se pueden obtener por la «cuenta de la vieja») La Figura también señala la frecuencia acumulada. Concretamente la columna 3, da la frecuencia acumulada de cada número, que es el número de inquilinos sin exceder el número total de los mismos.

Lógicamente, la última frecuencia acumulada es el número 45, o lo que es lo mismo la suma de todas las frecuencias, es decir, el número de apartamentos.

La distribución de frecuencias de la Figura se puede representar gráficamente por un histograma, el cual se muestra en la Figura Un histograma es simplemente un diagrama de barras donde la altura de cada barra indica el número de veces que el número dado aparece en la serie. De la misma manera, la distribución de frecuencias acumuladas podría ser representada por un histograma donde las alturas de las barras serían 8, 22, 29,…,45.

EJEMPLO 2

Supongamos que las temperaturas (en grados Fahrenheit) medidas a las 6:00 p.m. durante un período de 35 días son las siguientes:

72 78 86 93 106 107 98 82 81 77 87 82
91 95 92 83 76 78 73 81 86 92 93 84
107 99 94 86 81 77 73 76 80 88 91

Mejor que encontrar la distribución de frecuencias de cada elemento individual, es más útil construir una tabla de frecuencias que cuenta el número de veces que la temperatura observada se encuentra en un intervalo de ciertos límites. Esto se hace en la Figura.

Los números 70, 75, 80,… se llaman fronteras de clase o límites de clase. Si un elemento está en el límite de la clase se le suele asignar a la clase superior, por ejemplo, el 95 ha sido situado en el intervalo de clase 95-100. A veces una tabla de frecuencias también enumera cada marca de clase, es decir, el punto medio del intervalo de clase, que sirve como aproximación a los valores del intervalo.

La Figura muestra el histograma que corresponde a la distribución de frecuencias de la Figura. También muestra el polígono de frecuencias, que es la línea que se obtiene al unir los puntos medios de la parte superior de los rectángulos del histograma. Obsérvese que la línea se extiende desde el valor 67,5 en la izquierda hasta el 112,5 en la derecha. En tal caso, la suma de las áreas de los rectángulos es igual al área limitada por el polígono de frecuencia y eje de abscisas.

Fuente: Apuntes de Probabilidad y Estadística de la UNIDEG