Publicité
Test de Dixon (Test – Q). Rev. 00
Publicité

Contenu connexe

Publicité
Publicité

Test de Dixon (Test – Q). Rev. 00

  1. X1 X2 X3 X4 X5 X6 d w (rango) d = X6 – X5 w = X6 – X1 Q = d w Si Q > QCrít., se rechaza X6 Si Q < QCrít., se acepta X6 Representación: Dato anómalo o atípico Valor mínimo Valor máximo Valores críticos para el cociente de rechazo, Q, a diferentes niveles de confianza Adaptado de D. B. Rorabacher, Anal. Chem., 63(1991) 139. Procedimiento para su aplicación 1. Ordene los datos de menor a mayor. 2. Identifique el valor sospechoso (Xc). 3. Calcule la diferencia entre el número sospechoso y su más cercano vecino (xv) se divide entre el rango del conjunto (w), es decir, la diferencia entre el valor más alto y el más bajo. 4. Calcule el valor de Q. 5. Determine el valor crítico (QCrít), valores de Q tabulados para un número dado de observaciones a niveles diferentes de confianza (90, 95 y 99%). 6. Comparar valores y decida; (a) si el valor de Q calculado es igual o mayor a Qcrít., el dato sospechoso se puede rechazar. (b) Por otro lado, si el valor de Q es menor a Qcrít., el dato se debe conservar. Referencias Bibliográficas Christian, G. (2009). Química Analítica (Sexta ed.). México: McGraw-Hill/Interamericana Editores, S. A. de C. V. CONALEP. (2012). Análisis químico de la materia. México D. F., México: Secretaria de Educación Pública. Harris, D. (2016). Análisis Químico Cuantitativo (Tercera ed.). Barcelona, España: REVERTÉ. Miller, J. N., & Miller, J. C. (2002). Estadística y Quimiometría para Química Analítica (Cuarta ed.). Madrid, España: Pearson Educación S.A. Skoog, D., West, D., Holler, F., & Crouch, S. (2015). Fundamentos de química analítica (Novena ed.). México D.F., México: Cengage Learning Editores, S.A. de C.V. @jlcastros78 Micro Clases de Castro José Luis Castro Soto José Luis Castro Soto Micro Clases de Castro Ciudad Bolívar, Venezuela Código: InfoEstQui-01 / Revisión: 00 Test de Dixon (Test – Q) #MicroClasesDeCastro / Marzo, 2021 / Por: José Luis Castro Soto Se debe agregar, que existen una amplia gama de pruebas estadísticas para determinar si un dato se debe rechazar. En todas estas pruebas se establece un intervalo dentro del cual deben caer las observaciones estadísticamente significativas. La dificultad en todas ellas estriba en determinar cuál debe ser el intervalo. Si es demasiado pequeño, entonces se rechazarán datos perfectamente válidos; y si es demasiado grande, entonces se retendrán mediciones erróneas en una proporción demasiado alta. La experiencia y el sentido común pueden servir como base práctica para juzgar la validez de un dato anómalo. A menudo, un analista experimentado adquiere una buena idea de la precisión que se debe esperar con un método particular, y reconocerá cuándo es sospechoso un valor específico. Número de observaciones (N) QCrít. (Rechazar si Q > QCrít.) 90% de confianza 95% de confianza 99% de confianza 3 0,941 0,970 0,994 4 0,765 0,829 0,926 5 0,642 0,710 0,821 6 0,560 0,625 0,740 7 0,507 0,568 0,680 8 0,468 0,526 0,634 9 0,437 0,493 0,598 10 0,412 0,466 0,568 15 0,338 0,384 0,475 20 0,300 0,342 0,425 25 0,277 0,317 0,393 30 0,260 0,298 0,372 Ejemplo Nº 1 Durante un análisis del agua potable de una ciudad, para determinar el arsénico proporcionó valores de 5,64; 5,61; 5,91; 5,69 y 5,70 ppm. Unos de los valores parece ser anormal; ¿debería rechazarse dicho valor a un nivel de confianza de 90%? Generalmente, se considera inapropiado y en algunos casos poco ético el descartar sin razón el dato. Sin embargo, el resultado cuestionable, también llamado dato atípico, discordante o anómalo, puede ser resultado de un error no detectado. Por esto, es importante desarrollar un criterio para decidir si el dato se debe conservar o se debe rechazar. Introducción Hay ocasiones cuando se realiza una serie de análisis de réplicas, es posible que el conjunto de datos contenga uno (o posiblemente más) datos cuestionable o no coherente con los restantes, es decir, que difiera notablemente y de forma inexplicable de los otros, incluso que parezca estar fuera del intervalo de los errores aleatorios que podrían ser producidos por el procedimiento. Por desgracia, no hay criterios uniformes que se puedan usar para decidir si un dato atípico se pueda atribuir a un error accidental más que a una variación casual. No se puede negar lo tentador que es eliminar los valores extremos del conjunto de datos porque alterarán la estadística de modo desfavorable; es decir, aumentan la desviación estándar (s) y la varianza (s2), medidas de la dispersión, y pueden alterar la media reportada. Sin embargo, la única base confiable para el rechazo ocurre cuando es posible decidir que se pudo haber cometido un error específico al obtener el resultado dudoso. Ningún resultado debe retenerse en casos en los que ha ocurrido un error conocido en su obtención. El Test-Q o Prueba Q: Prueba de rechazo de un dato cuestionable o sospechoso Teniendo en cuenta, que no existe una regla universal para decidir si un dato se debe conservar o se debe rechazar. Sin embargo, el Test - Q o prueba Q, que es considerada como un método simple y estadísticamente apropiado que nos ayuda a tomar la decisión de retener o descartar un dato para un determinado número de observaciones, con el objeto de garantizar una distribución normal o gaussiana al conjunto. Ejemplo Nº 2 Se obtuvieron los siguientes valores para la concentración de nitrito (mg·L-1) en una muestra de agua de rio: 0,403: 0,410; 0,401 y 0,380. La última medida aparenta ser sospechosa, ¿debería ser rechazada? 5,6 5,7 5,8 5,9 6,0 5,61 5,64 5,69 5,91 Paso a paso: 1. Ordene los datos de menor a mayor (5,61; 5,64; 5,69; 5,70 y 5,91. 2. Identifique el dato sospechoso (5,91 ppm). 3. Difiere al valor más cercano; d = 5,91-5,70 = 0,21 ppm. 4. El rango es: w = 5,91–5,61 = 0,30 ppm. 5. Por tanto, Q = 0,70. 6. El valor QCrit- para cinco observaciones es 0,642 a un nivel de confianza de 90%. 7. Como el Q > QCrit-, el test justifica el rechazo del dato atípico. Q = Cálculos: Q = 5,91 - 5,61 5,91 - 5,70 0,21 0,30 0,70 = d w = 0,70 > 0,642 (Puede rechazar el dato) Q = 0,70 QCrit. = 0,642 d w (1) (2) (3) 5,70 Valor atípico Conclusión Algunos sostienen que nunca se debe descartar nunca un dato a menos que se sepa que existe un error en el procedimiento que condujo a esa medida particular. Otros repiten la medida sospechosa varias veces más, para asegurarse mejor si la medida realmente está o no fuera de lo esperable. La decisión depende de uno, y es por tanto una cuestión personal. Lo mejor es repetir la medida varias veces para aumentar la probabilidad de que la decisión tomada es correcta. Pero, de no quedar más alternativas, debemos recurrir al Test - Q. Recomendaciones para tratar datos atípicos Para el tratamiento de un conjunto de datos en el que hay un valor sospechoso, es decir, si una de las observaciones es bastante diferente de las otras del conjunto y si la precisión es considerablemente peor que la esperada, se sugiere: 1. Si es posible, estimar la precisión que podría ser esperada de manera razonable en el procedimiento para asegurarse de que el dato atípico es realmente cuestionable. 2. Examinar cuidadosamente todos los datos relacionados con el dato atípico para determinar si es posible que un error bruto afectara dicho valor. 3. Repetir el análisis si se cuenta con disponibilidad de muestra y tiempo. Una concordancia entre datos nuevos y los datos del análisis original que parecen ser válidos le va a dar peso a la noción de que el dato atípico debe ser rechazado. Más aún, si se indica conservar el resultado, el dato atípico tendrá poco efecto en la media de un conjunto de datos más grande. 4. Si no se pueden obtener nuevos datos, aplicar la prueba Q al conjunto existente para observar si el resultado dudoso debe ser rechazado o conservado basándose sobre pruebas estadísticas. 5. Si la prueba Q indica que el dato debe conservarse, considere reportar la mediana del conjunto, en lugar de la media para un pequeño conjunto de datos. La mediana tiene la gran virtud de permitir la inclusión de todos los datos en un conjunto sin estar sujeta a la influencia de un dato atípico. Más aún, la mediana de un conjunto de tres mediciones distribuido de manera normal proporciona una mejor estimación del valor correcto que la media del conjunto después de que el dato atípico ha sido descartado. En esta prueba, la relación Q se calcula determinando el valor absoluto de la diferencia del resultado cuestionable o sospechoso “xc“ y su vecino más cercano “xv”, al cual llamamos “d”, y se divide entre el rango (w) del conjunto. Q = w xc - xv = w d Agradecimientos A los participantes del Laboratorio de Química de la Universidad Politécnica Territorial del Estado Bolívar (UPTEB): Alejandro Saavedra, Génesis Miranda, Karlenis Salas, Oranjelin Guzmán, Rosanny Pérez, Yuber Pérez y Ze Manue Bolívar, por participar y facilitar las fotografías empleadas en este recursos. Paso a paso: 1. Ordene los datos de menor a mayor (0,380; 0,401; 0,403 y 0,410) 2. Identifique el dato sospechoso (0,380 mg·L-1). 3. Difiere al valor más cercano; d = 0,380 - 0,401 = 0,021 mg·L-1. 4. El rango es: w = 0,410 - 0,380 = 0,030 mg·L-1. 5. Por tanto, Q = 0,7. 6. El valor QCrit- para cuatro (4) muestras es 0,829 a un nivel de confianza de 95%. 7. Como el Q < QCrit-, el test no justifica el rechazo del dato, por tanto debe aceptarse la medida. Q = Cálculos: Q = 0,410 - 0,380 0,380 - 0,401 0,021 0,03 0,7 = d w = 0,7 < 0,829 (No rechazar el dato) Q = 0,7 QCrit. = 0,829 0,380 0,410 0,390 0,400 d w (1) (2) (3) Valor atípico Es importante destacar, que el seleccionar un criterio para rechazar un resultado sospechoso tiene sus peligros; 1. Establecer un estándar muy estricto, sería muy difícil rechazar un resultado atípico y se corre el riesgo de retener este valor, el cual tendría un efecto en la media. 2. Establecer un límite muy blando, con el cual se rechaza fácilmente el valor atípico, se podría estar descartando un valor que por derecho propio pertenece al conjunto y, por lo tanto, se introduce un sesgo en los datos. Casos especiales: Considere, que para tres (3) mediciones con dos (2) de los puntos idénticos o muy cercanos. En ese caso, la prueba casi siempre indica rechazo del tercer valor, sin importar la magnitud de la desviación, porque “d” es igual a “w”, y Q es siempre igual a 1. Observe Q = 4,6 – 4,5 4,6 – 4,5 0,1 0,1 1,0 = d w = = • Para los valores: 4,5; 4,5 y 4,6 Q = 9,0 – 4,5 9,0 – 4,5 4,5 4,5 1,0 = d w = = • Para los valores: 4,5; 4,5 y 9,0 Lo mismo se aplica, obviamente, para tres (3) puntos de datos idénticos en cuatro (4) mediciones, y así sucesivamente. En este sentido, no debe aplicarse la prueba Q.
Publicité