Este documento presenta información sobre estadística descriptiva y su aplicación en la gestión empresarial. Explica conceptos como histogramas, pruebas de normalidad, gráficos de probabilidad y distribución para datos normales. También describe el gráfico de control X-barra R y cómo identificar patrones atípicos que indican que un proceso está fuera de control. El objetivo es mostrar cómo las herramientas estadísticas pueden usarse para analizar datos cuantitativos y tomar decisiones informadas sobre productos y procesos.
Factores que intervienen en la Administración por Valores.pdf
Reporte interpretación y aplicación de control estadístico de proceso con minitab
1. INSTITUTO TECNOLOGICO DE COMITANCILLO
CARRERA:
ING. EN GESTION EMPRESARIAL
MATERIA:
CALIDAD APLICADA A LA GESTION EMPRESARIAL
NOMB. DEL PROF(A):
DR. JULIO CESAR DEHESA VALENCIA
NOMB. DEL ALUMNO:
ALEJANDRO JIMENEZ ANTONIO
GRUPO: “U” (S.A.)
SAN PEDRO COMITANCILLO, OAX.
2. INDICE
Qué es estadística
Aplicación de estadística descriptiva
Interpretación histograma
Prueba de normalidad
Gráfica de probabilidad de datos normales
Gráfica de distribución
Gráfico X-bar R de datos normales
Interpretación de Gráfica de antes y después (before/after) en histogramas
Reporte de capacidad del proceso sixpack
3. QUE ES LA ESTADISTICA
La Estadística estudia los métodos científicos para recoger, organizar,
resumir y analizar datos, asi como para sacar conclusiones validas y tomar
decisiones razonables basadas en tal análisis.
4. APLICACIÓN DE LA ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva es aplicable en casi todas las áreas donde se
recopilan datos cuantitativos. Puede brindar información acerca de
productos, procesos o diversos aspectos del sistema de gestión de la
calidad, como también en el ámbito de la dirección y organización de
personas, la logística, etc. Algunos ejemplos de dichas aplicaciones son
los siguientes:
Resumen de las mediciones principales de las características de un
producto.
Describir el comportamiento de algún parámetro del proceso, como
puede ser la temperatura de un horno.
Caracterizar el tiempo de entrega o el tiempo de respuesta en el
sector de los servicios.
Procesar datos relacionados con muestras a clientes, tales como la
satisfacción o insatisfacción del cliente.
Ilustrar la medición de los datos, tales como los datos de calibración
del equipo.
Visualizar el resultado del desempeño de un producto en un periodo
mediante un gráfico de tendencia.
5. INTERPRETACION HISTOGRAMA
Los histogramas son gráficos que indican la frecuencia de un hecho
mediante una distribución de los datos. Los histogramas no se pueden
elaborar con atributos, sino con variables medibles tales como peso,
temperatura, tiempo, etc.
En definitiva, un histograma es una representación grafica de una variable en
forma de barras donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. en el eje vertical se representan las frecuencias y
en el eje horizontal los valores de las variables normalmente señalando las
marcas de clase es decir la mitad del intervalo en el que están agrupados los
datos.
Por su naturaleza grafica el histograma puede ayudar a identificar e interpretar
pautas que son difíciles de ver con una simple tabla de números y que son de
poco valor si no aparecen suficientemente ordenados y clasificados.
su interpretación es el resultado del análisis que se produce al interpretar el
histograma es una teoría sobre el funcionamiento del proceso o sobre la causa
del problema que se está investigando por lo tanto siempre es necesario
confirmarla o rechazarla obteniendo datos que corroboren las conclusiones
obtenidas.
6. PRUEBA DE NORMALIDAD
En estadística, las pruebas de normalidad se utilizan para determinar si un
conjunto de datos está bien modelado por una distribución normal o para
calcular la probabilidad de una variable aleatoria subyacente al conjunto
de datos se distribuya normalmente.
En términos de estadística descriptiva, se mide la bondad de ajuste de un
modelo normal a los datos; si el ajuste es deficiente, los datos no están
bien modelados a ese respecto por una distribución normal, sin emitir un
juicio sobre ninguna variable subyacente.
En las pruebas de hipótesis estadísticas de las estadísticas frecuentistas,
los datos se contrastan con la hipótesis nula de que se distribuyen
normalmente.
En las estadísticas bayesianas, uno no «prueba la normalidad» per se,
sino que calcula la probabilidad de que los datos provengan de una
distribución normal con parámetros dados μ, , y lo compara con la
probabilidad de que los datos provienen de otras distribuciones bajo
consideración, la mayoría simplemente usando un factor de Bayes, o más
finamente tomando una distribución previa sobre posibles modelos y
parámetros y calculando una distribución posterior dadas las
probabilidades calculadas.
Se utiliza una prueba de normalidad para determinar si los datos de la
muestra se han extraído de una población distribuida normalmente.
7. TIPOS DE PRUEBAS DE NORMALIDAD
Los siguientes son tipos de pruebas de normalidad que puede utilizar para
evaluar la normalidad.
Prueba de Anderson-Darling
Esta prueba compara la función de distribución acumulada empírica
(ECDF) de los datos de la muestra con la distribución esperada si los datos
fueran normales. Si la diferencia observada es adecuadamente grande,
usted rechazará la hipótesis nula de normalidad de la población.
Prueba de normalidad de Ryan-Joiner
Esta prueba evalúa la normalidad calculando la correlación entre los datos
y las puntuaciones normales de los datos. Si el coeficiente de correlación
se encuentra cerca de 1, es probable que la población sea normal. El
estadístico de Ryan-Joiner evalúa la fuerza de esta correlación; si se
encuentra por debajo del valor crítico apropiado, usted rechazará la
hipótesis nula de normalidad de la población. Esta prueba es similar a la
prueba de normalidad de Shapiro-Wilk.
8. Prueba de normalidad de Kolmogorov-Smirnov
Esta prueba compara la función de distribución acumulada empírica
(ECDF) de los datos de la muestra con la distribución esperada si los datos
fueran normales. Si esta diferencia observada es adecuadamente grande,
la prueba rechazará la hipótesis nula de normalidad de la población. Si el
valor p de esta prueba es menor que el nivel de significancia (α) elegido,
usted puede rechazar la hipótesis nula y concluir que se trata de una
población no normal.
9. COMPARACIÓN DE LAS PRUEBAS DE NORMALIDAD DE
ANDERSON-DARLING, KOLMOGOROV-SMIRNOV Y RYAN-
JOINER
Las pruebas de Anderson-Darling y Kolmogorov-Smirnov se basan en la
función de distribución empírica. La prueba de Ryan-Joiner (similar a la
prueba de Shapiro-Wilk) se basa en regresión y correlación.
Las tres pruebas tienden a ser adecuadas para identificar una distribución
no normal cuando la distribución es asimétrica. Las tres pruebas
distinguen menos cuando la distribución subyacente es una distribución t
y la no normalidad se debe a la curtosis. Por lo general, entre las pruebas
que se basan en la función de distribución empírica, la prueba de
Anderson-Darling tiende a ser más efectiva para detectar desviaciones en
las colas de la distribución. Generalmente, si la desviación de la
normalidad en las colas es el problema principal, muchos profesionales de
la estadística usarían una prueba de Anderson-Darling como primera
opción.
10. GRAFICA DE PROBABILIDAD DE DATOS NORMALES
El gráfico de probabilidad normal es una técnica gráfica, utilizada para
contrastar la normalidad de un conjunto de datos. Permite comparar la
distribución empírica de una muestra de datos, con la distribución normal.
Es un caso particular de gráfico de probabilidad.
La idea básica consiste en representar, en un mismo gráfico, los datos
empíricos observados, frente a los datos que se obtendrían en una
distribución normal teórica. Si la distribución de la variable es normal, los
puntos quedarán cerca de una línea recta. Es frecuente observar una
mayor variabilidad (separación) en los extremos.
El gráfico de probabilidad normal es un caso especial de gráfico de
probabilidad.
11. GRAFICA DE DISTRIBUCION
Se dice que muchos fenómenos en el campo de la salud se distribuyen
normalmente. Esto significa que, si uno toma al azar un número
suficientemente grande de casos y construye un polígono de frecuencias
con alguna variable continua, por ejemplo, peso, talla, presión arterial o
temperatura, se obtendrá una curva de características particulares,
llamada distribución normal. Es la base del análisis estadístico, ya que en
ella se sustenta casi toda la inferencia estadística.
La gráfica de la distribución normal tiene la forma de una campana, por
este motivo también es conocida como la campana de Gauss. Sus
características son las siguientes:
• Es una distribución simétrica.
• Es asintótica, es decir sus extremos nunca tocan el eje horizontal, cuyos
valores tienden a infinito.
• En el centro de la curva se encuentran la media, la mediana y la moda.
• El área total bajo la curva representa el 100% de los casos.
• Los elementos centrales del modelo son la media y la varianza.
Esta distribución es un modelo matemático que permite determinar
probabilidades de ocurrencia para distintos valores de la variable. Así, para
determinar la probabilidad de encontrar un valor de la variable que sea
igual o inferior a un cierto valor xi, conociendo el promedio y la varianza de
un conjunto de datos, se debe reemplazar estos valores (media, varianza
y xi) en la fórmula matemática del modelo. El cálculo resulta bastante
complejo pero, afortunadamente, existen tablas estandarizadas que
permiten eludir este procedimiento.
En el gráfico, el área sombreada corresponde a la probabilidad de
encontrar un valor de la variable que sea igual o inferior a un valor dado.
Esa probabilidad es la que aprenderemos a determinar usando una tabla
estandarizada.
12. Tabla de la distribución normal
La tabla de la distribución normal presenta los valores de probabilidad para
una variable estándar Z, con media igual a 0 y varianza igual a 1.
Para usar la tabla, siempre debemos estandarizar la variable por medio de
la expresión:
Siendo el valor de interés; la media de nuestra variable y su desviación
estándar. Recordemos que y corresponden a parámetros, o sea valores
en el universo, que generalmente no conocemos, por lo que debemos
calcular Z usando los datos de nuestra muestra.
En general, el valor de Z se interpreta como el número de desviaciones
estándar que están comprendidas entre el promedio y un cierto valor de
variable x. En otras palabras, se puede decir que es la diferencia entre un
valor de la variable y el promedio, expresada esta diferencia en cantidad
de desviaciones estándar.
Suena abstracto, pero con un ejemplo se podrá entender mejor:
Supongamos un conjunto de personas con edad promedio 25 años y
desviación estándar 3,86. Nuestro valor de interés (x) es 30 años. El valor
de Z correspondiente será:
13. Este valor de Z nos dice que la edad de 30 años está a 1,29 desviaciones
estándar sobre el promedio.
Ahora bien, la tabla de la distribución normal, entrega valores de
probabilidad para los distintos valores de Z.
¿Cómo se usa la tabla de Z?
Lo averiguaremos con un valor concreto: ¿cuál es la probabilidad de
encontrar un valor de Z menor o igual a 1,96?
Vamos a la tabla y familiaricémonos con algunas de sus características.
▪ En la primera columna de la tabla aparece el entero y primer decimal del
valor de Z, vemos que los valores van desde -3,4 a 3,3. En la primera fila
(arriba), aparece el segundo decimal del valor de Z y, como es lógico, hay
10 números (0,00 a 0,09).
▪ Entonces, para nuestro valor de Z = 1,96 buscaremos 1,9 en la primera
columna de la tabla y 0,06 en la primera fila de la tabla. Trazaremos líneas
perpendiculares desde esos valores y llegaremos a un número en el
cuerpo de la tabla (véase la tabla más abajo, que tiene marcadas las dos
perpendiculares de las que hablamos. El número que encontramos y que
está destacado es: 0,9750.
▪ Por lo tanto, la probabilidad asociada a Z=1,96 es 0,9750, es decir, la
probabilidad de encontrar un valor de Z menor o igual a 1,96 es 0,9750.
En nuestro ejemplo anterior, con la edad 30 años, vemos que el valor Z =
1,29 tiene una probabilidad asociada de 0,9014. Entonces, la probabilidad
de encontrar una persona con edad de 30 años o menos, en este grupo
humano, es 0,9014.
16. GRÁFICO X-BAR R DE DATOS NORMALES
La Gráfica de Control Xbar-R son un par de gráficas de control en una
sola hoja, en la parte superior se grafica el promedio Xbar de las muestras
recolectadas; de esta manera se monitorea la estabilidad de la media
(valor de tendencia central). En la parte inferior se gráfica el rango R de
las muestras recolectadas; de esta manera se monitorea la estabilidad de
la dispersión del proceso. La Gráfica de Control Xbar-R se utiliza cuando
el tamaño de muestra n ≤ 9, además de para cuando se realiza alguna
prueba destructiva.
Pasos para llenar una Gráfica Xbar-R
1. Se toma la muestra de tamaño n y se registran los valores obtenidos. 2.
Se calcula el promedio de la muestra y éste se grafica en la gráfica Xbar.
3. Se calcula el rango R de la muestra obtenida y se grafica en la gráfica
R del mismo formato 4. Se verifica que los puntos recién graficados estén
dentro de los límites de control establecidos y que no presenten un patrón
“sospechoso”. 5. Si lo anterior no se cumple se debe tomar alguna acción
para regresar el proceso a control.
Ejemplo
Supongamos que se quiere implementar una gráfica de control Xbar-R en
un proceso estable cuya media es m = 20 y cuya desviación estándar es
S = 6. Se decide muestrear 1 vez por turno y cada muestra debe ser de
tamaño n = 4. Como las muestras son de tamaño n = 4 y la desviación
estándar del proceso es S = 6, entonces Sx = 3. Por lo tanto el Límite de
Control Superior es LCS = 20 + 3*3 = 29. El Límite de Control Inferior es
LCI = 20 – 3*3 = 11. La línea central de la gráfica Xbar es la media m = 20.
Los límites para el rango son LCS = 28.2 y LCI = 0.0
17. Patrones atípicos en una gráfica de control
Los patrones atípicos son una serie de puntos graficados cuyo
comportamiento muestra evidencia de que el proceso está perdiendo
estabilidad y por lo tanto saliéndose de control. Existe una serie de varios
patrones atípicos clásicos observados en gráficas de control y se muestran
enseguida:
• Por lo menos 7 puntos continuamente ascendentes o descendentes
advierten de un corrimiento gradual en la media del proceso
• Por lo menos 7 puntos consecutivos del mismo lado de la media advierten
de cambio súbito en la media
• Por lo menos 15 puntos consecutivos pegados a la media advierten de
cambio de nivel de control de proceso a menor variación. S la nueva
condición se muestra estable es momento de recalcular los límites de
control
18. • Puntos que fluctúan erráticamente de un lado a otro de la media advierten
de por lo menos una causa de variación especial de gran dimensión
perturbando al proceso. Se requiere tomar acciones para su eliminación.
• Si se está actuando sobre el proceso existe probablemente “sobreajuste”:
mover el proceso cuando no es necesario.
• 1 punto fuera de límites no necesariamente implica que el proceso esté
fuera de control.
• Recordemos que existe una probabilidad de 0.27% de encontrar puntos
fuera de control aún cuando el proceso está controlado.
• Se recomienda tomar una nueva muestra para corroborar.
19. • Si la nueva muestra regresa a la normalidad, el proceso se puede
considerar controlado.
• Es “normal” que 1 punto de cada 370 se encuentre fuera de los límites
de control.
• Si la nueva muestra sigue fuera de control o muy pegada a uno de los
límites, el proceso se considera fuera de control y se deben tomar acciones
para regresarlo a estado estable.
• Ha ocurrido un cambio abrupto en las condiciones del proceso que debe
ser resuelto.
• Este patrón sólo ocurre de manera “natural” 1 de cada 549 mil veces
aproximadamente.
20. Utilidad de una gráfica de control
Nos permite examinar un proceso para saber si éste se encuentra
en estado estable y así mantenerlo.
Nos permite reaccionar oportunamente antes cualquier variación
especial introducida al proceso.
Nos permite entender mejor el comportamiento natural de nuestros
procesos.
Nos permite “medir” el impacto de nuestras acciones en nuestros
procesos.
Nos permite entender mejor el impacto de las diferentes fuentes de
variación en nuestros procesos
Método de implementación de una gráfica de control
Para colectar los datos es necesario definir los subgrupos y un plan
de muestreo.Un subgrupo es un conjunto que tiene características
idénticas entre sí; por ejemplo, las piezas producidas por la misma
máquina en el mismo turno y con los mismos lotes de materiales se
puede considerar un “subgrupo”.
Definir subgrupos racionales. Para minimizar la variación por causas
especiales dentro del subgrupo. Se sugiere tomar lecturas
consecutivas. Para maximizar la detección de causas especiales
entre subgrupos se sugiere establecer frecuencia de muestreo tal,
que permita la variedad de subgrupos en la recolección.
El tamaño de subgrupo o “tamaño de muestra” se recomienda que
sea entre 3 y 5.
La frecuencia establece cada cuánto tiempo se recolecta la
información del proceso, se suele recolectar cada turno.
El número de subgrupos mínimo necesario, o la cantidad de
muestras repetidas que se recomiendan para empezar debe reunir
en total entre 100 o 125 lecturas individuales, cuando menos. Por
ejemplo, 20 muestras de tamaño 5 o 25 muestras de tamaño 4.
21. Control Estadístico de Proceso vs Muestreo Estadístico de Producto
Si los métodos de control son aplicados sobre las variables del
proceso, hablamos de “Control Estadístico de Proceso”.
Controlar las variables clave de entrada de nuestros procesos nos
permite prevenir errores.
Si los métodos de control son aplicados sobre las características del
producto, hablamos de “Control Estadístico de Producto”.
Es bueno para comenzar, sin embargo sólo detecta errores ya
cometidos.
22. INTERPRETACIÓN DE GRÁFICA DE ANTES Y DESPUÉS
(BEFORE/AFTER) EN HISTOGRAMAS
Los histogramas son ayudas visuales que permiten mostrar la información
en forma de gráficos de barras u otros que distingan a un grupo dado o
tendencia. Para las personas que necesiten ver cómo interpretar un
histograma, aquí están los pasos.
1.-Comprende el papel de los histogramas. Entiende el contexto en el
cuál es utilizado sirve para darle una mejor idea a los principiantes acerca
de lo que el histograma quiere mostrar.
2.- Aprende acerca del uso de frecuencias. La frecuncia en un
histograma es comúnmente utilizada en el eje vertical del gráfico y expresa
con un número la cantidad de veces que un determinado elemento
aparece en la muestra.
3.- Comprende los rangos que se muestran en lado horizontal. El eje
horizontal comúnmente muestra todas las posibilidades para esta muestra.
4.- Evalúa el histograma y busca si hubo un proceso de normalización
o el histograma está a escala. A veces los gráficos son cambiados con
un proceso llamado normalización que elimina los datos que podrían ser
confusos. Entender cómo funcionan este proceso te permitirá entenderlos
más fácilmente.
5.- Lee el contexto del histograma. El título es una parte importante pues
provee toda la información necesaria para comprender el mismo. Así
mismo, es importante conocer el objetivo que la persona o institución que
está mostrando el histograma busca. Todos estos datos te ayudarán a
entender el gráfico de mejor manera.