Un histograma es un gráfico que permite representar la distribución de frecuencia (forma) de un conjunto de datos numéricos y es considerado como una de las siete herramientas básicas de calidad.
Este gráfico se utiliza para resumir datos discretos o continuos. En otras palabras, proporciona una interpretación visual de los datos numéricos al mostrar el número de puntos de datos que se encuentran dentro de un rango específico de valores (llamados “intervalos”). Es similar a un gráfico de barras verticales. Sin embargo, un histograma, a diferencia de un gráfico de barras verticales, no muestra espacios entre las barras.
¿Cuando usar un histograma?
Los histogramas se pueden usar para:
- Analizar datos numéricos
- Saber si un proceso cumple con los requisitos de calidad
- Ver si se ha producido un cambio de proceso de un período de tiempo a otro
- Determinar si las resultados de dos o más procesos son diferentes
- Establecer metas u objetivos de variación media el proceso, haciendo que el proceso cumpla con los requisitos actuales o nuevos
¿Cómo construir un histograma?
Para construir un histograma, el primer paso es agrupar el rango de valores, es decir, dividir todo el rango de datos en una serie de intervalos, y luego contar cuántos valores caen en cada intervalo. Los intervalos deben ser adyacentes y, a menudo pero no obligatoriamente, del mismo tamaño.
¿Cómo elegir el tamaño del intervalo?
No existe el “mejor” número de intervalos, y diferentes tamaños de intervalo pueden revelar diferentes características del conjunto de datos.
Dependiendo de la distribución de datos real y los objetivos del análisis, pueden ser apropiados diferentes anchos de intervalo, por lo que generalmente se debe experimentar para determinar un ancho apropiado. Sin embargo, existen varias pautas y reglas prácticas útiles.
El número de intervalos k se puede asignar directamente o se puede calcular a partir de un ancho de intervalo sugerido h como:
Raíz cuadrada
Toma la raíz cuadrada del número de datos en la muestra y redondea al siguiente entero.
Fórmula de Sturges
Esta fórmula puede funcionar mal si n <30, porque el número de intervalos será pequeño (menos de siete) y es poco probable que muestre bien las tendencias en los datos. También puede funcionar mal si los datos no se distribuyen normalmente.
Regla de Rice
Formas comunes de histograma y su significado
Distribución normal
Un patrón común es la curva en forma de campana conocida como “distribución normal”.
Distribución sesgada
La distribución sesgada es asimétrica porque un límite natural evita los resultados en un lado. El punto más alto de la distribución está descentrado hacia el límite y una cola se aleja de él. Estas distribuciones se denominan sesgadas hacia la derecha o hacia la izquierda según la dirección de la cola.
Doble pico o bimodal
La distribución bimodal suele suceder cuando los resultados de dos procesos con diferentes distribuciones se combinan en un conjunto de datos. Por ejemplo, una distribución de datos de producción de una operación de dos turnos podría ser bimodal, si cada turno produce una distribución de resultados diferente.
Distribución truncada
La distribución truncada parece una distribución normal con las colas cortadas. Este tipo de distribución es común cuando un proveedor podría estar produciendo una distribución normal de material y luego durante una inspección final separa lo que está dentro de los límites de especificación de lo que está fuera de especificación.
También te puede interesar
- Herramientas de Mejora en la Gestión de la Calidad
- ¿Qué es el modelo Kaizen?
- Variabilidad en el desempeño
- Diagrama de Pareto
- ¿Qué es calidad?
Agregue un comentario