Histograma

En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores contiguos. En los casos en los que los datos son cualitativos (no-numéricos), como sexo, grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas.

Construcción de un histograma

  • Paso 1: Determinar el rango de los datos: RANGO es igual al dato mayor menos el dato menor; R = > – <
  • Paso 2: Obtener el número de clases, existen varios criterios para determinar el número de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 ( número de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
  • Paso 3: Establecer la longitud de clase: es igual al rango entre el número de clases.
  • Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos iguales.
  • Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.

Histograma de una imagen

El histograma de una imagen representa la frecuencia relativa de los niveles de gris de la imagen. Las técnicas de modificación del histograma de una imagen son útiles para aumentar el contraste de imágenes con histogramas muy concentrados.

Sea u una imagen de tamaño NxN, la función de distribución del histograma es: Fu(l) = (Numerodepixels(i,j)talesqueu(i,j) < = l) / N2

Ejemplo

A una fabrica de envases de vidrio, un cliente le está exigiendo que la capacidad de cierto tipo de botella sea de 13 ml, con una tolerancia de más menos 1 ml. La fábrica establece un programa de mejora de calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente.

Ejemplos de otros tipos de representaciones gráficas: Hay histogramas donde se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase).

Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).

A veces es más útil representar las frecuencias acumuladas.

O representar simultáneamente los histogramas de una variable en dos situaciones distintas.

Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos situaciones distintas.

Otra forma

En las variables cuantitativas o en las cualitativas ordinales se pueden representar polígonos de frecuencia en lugar de histogramas, cuando se representa la frecuencia acumulativa, se denomina ojiva.