SlideShare une entreprise Scribd logo
1  sur  34
Indicadores de calidad de un instrumento para evaluación por competencias. Carlos Gabriel Contreras S. Estadístico UCLA
Agenda de trabajo. Confiabilidad. Validez.
Confiabilidad. La confiabilidad (o consistencia) de un test es la precisión con que el test mide lo que mide, en una población determinada y en las condiciones normales de aplicación. (Anastasi, 1982; Aiken, 1995) (Las condiciones normales de aplicación se refieren a las condiciones especificadas en el manual del test).
Confiabilidad. La falta de confiabilidad de un test psicométrico esta en relación con la intervención del error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados de la medición que influye sobre la falta de confiabilidad de tal medición.
Error. El error es de dos tipos: a) Error constante (sistemático), que se produce cuando las mediciones que se obtienen con una escala son sistemáticamente mayores o menores que lo que realmente deben ser. b) Error causal (al azar o no sistemático), que se produce cuando las medidas son alternativamente mayores o menores de lo que realmente deben ser.
Error causal. Interviene cuando se afecta la confiabilidad de un test psicométrico. Este error tiene que ver con la salud, fatiga, motivación, tensión emocional, fluctuaciones de la memoria, condiciones externas de luz, humedad, ventilación, calor, distracción por problemas del momento, familiaridad con la prueba, que presenta el examinado al momento de dar el test (Rey, 1972; Brown,1982)
Representaciones estadísticas de la confiabilidad. Error estándar de medida. Coeficiente de confiabilidad.
Coeficiente de confiabilidad. Es un coeficiente de correlación entre dos grupos de puntajes e indica el grado en que los individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1. Cuanto más se acerque el coeficiente a 1, más confiable será la prueba.
Coeficiente de confiabilidad. El coeficiente de confiabilidad señala la cuantía en que las medidas del test están libres de errores casuales o no sistemáticos. Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas de aplicación del test el 95% de la varianza de los puntajes directos se debe a la auténtica medida, y sólo el 5%, a errores aleatorios.
Obtención del coeficiente. Método de las formas equivalentes Método del test-retest Método de la división por mitades emparejadas o "splithalf method“ Método de la equivalencia racional o de Kuder-Richardson.
Formas equivalentes. Se aplican dos formas equivalentes o paralelas del test al mismo grupo de individuos, y las dos series de puntajes resultantes se correlacionan con el coeficiente producto de los momentos de Pearson (r).
Test Retest. Se aplica dos veces el mismo test (el lapso entre las aplicaciones se determina previamente), a una misma muestra de individuos. Las dos series de puntajes resultantes se correlacionan con el coeficiente de correlación "r" de Pearson.
Split half Se aplica el test una sola vez a una muestra. Luego, se califica por separado los ítemes pares (2, 4, 6, ..., n) y los ítemes impares (1, 3, 5, ..., n). A continuación, las dos series de puntajes resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido el test en dos partes (ítemes pares e ítemes impares), el "r" resultante debe ser "corregido" para arrojar el "r“ para todo el test. Esta corrección se efectúa con la fórmula de profecía de Spearman-Brown:
Equivalencia racional. Método de la equivalencia racional: En este método se considera que si un test esta formado por un conjunto de ítemes estos pueden ser considerados como un conjunto de tests paralelos (tantos como ítemes tenga el test). Luego se deriva una ecuación para computar el coeficiente de confiabilidad. Kuder y Richardson derivaron varias fórmulas para el cálculo del coeficiente de confiabilidad, son las más conocidas la KR20 y la KR21. Actualmente,un coeficiente más utilizado es el coeficiente alfa de Cronbach(1972; Anastasi, 1982; Aiken, 1995).
Error estándar de medida. Por medio de este error estándar de medida se estima el intervalo probable de puntajes en el cual se encontrará el puntaje verdadero de un sujeto examinado con un test psicométrico.
Error estándar de medida. s = Desviación estándar de los puntajes de la distribución. rxx = Coeficiente de confiabilidad del test. 1 = Constante. Obtenido el EEM, debemos escoger el nivel de confianza: - Nivel de confianza del 68% = PD ± 1 EEM. - Nivel de confianza del 95% = PD ± 2 EEM.
EEM Para el nivel de confianza del 68% la interpretación es la siguiente: "Podemos concluir, con un 68% de confianza, que el puntaje verdadero de un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1 EEM". El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD) y ± 2 EEM"
Validez. Si tenemos una prueba “X” nos equivocaríamos al creer que su titulo nos dice lo que la prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a obtener una medida, por ejemplo, de razonamiento numérico o de las estrategias de aprendizaje. La averiguación de lo que la prueba mide no responde a la pregunta ¿cómo llama el autor a la prueba?, sino más bien ¿a qué hacen referencia los puntajes obtenidos en esta?, ¿es válido el uso o la interpretación de las puntuaciones de este test?, ¿qué generalizaciones se pueden hacer apropiadamente a partir de la puntuación en esta prueba? (Thorndike, 1989).
Distinción entre validez y confiabilidad. La distinción entre confiabilidad y validez se basa en lo que consideramos como error. En la validez interesan los errores constantes o sistemáticos y en la confiabilidad los errores aleatorios o no sistemáticos. El siguiente ejemplo nos permitirá precisar la diferencia entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se trata de un buen cronometro el tiempo que marca será confiable (es decir consecuente), pero no será valido en comparación con el tiempo estándar (hora GMT).
Definición de validez En términos estadísticos la validez se define como la proporción de la varianza verdadera que es relevante para los fines del examen. Con el término relevante nos referimos a lo que es atribuible a la variable, características o dimensión que mide la prueba.
Definición de validez. Generalmente la validez de un test se define ya sea por medio de (1) la relación entre sus puntuaciones con alguna medida de criterio externo, o bien (2) la extensión con la que la prueba mide un rasgo subyacente específico hipotético o “constructo”.
Definición de validez. En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford, 1946, citado en Muñiz, 1996, p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los puntajes de las pruebas, que son función no sólo de los ítemes sino también de la forma de responder de las personas así como del contexto de la evaluación.
Definición de validez Es decir, lo que se valida no es la prueba sino las inferencias hechas a partir de la misma, lo que tiene dos importantes consecuencias: a) el responsable de la validez de una prueba ya no es solo su constructor sino también el usuario, y b) la validez de una prueba no se establece de una vez por todas sino que es resultado del acopio de evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo que comprende todas las cuestiones
En síntesis…. En este contexto, el concepto validez refiere a la adecuación, significado y utilidad de las inferencias específicas hechas con las puntuaciones del los tests.
La validez no se puede resumir en un solo indicador o índice numérico, al igual que ocurre con la confiabilidad (p.e., el coeficiente de confiabilidad), sino que la validez de las puntuaciones de un test se asegura mediante la acumulación de evidencia teórica, estadística, empírica y conceptual del uso de las puntuaciones.
Validez de contenido. ¿Los ítems que constituyen el test son realmente una muestra representativa del dominio de contenido o dominio conductual que nos interesa? La validez de contenido consiste en determinar lo adecuado del muestreo de reactivos del universo de reactivos posibles; en este sentido, es una “medida” de lo adecuado del muestreo.
Validez de constructo. Grado en que la medida refleja el constructo.  Se enfoca en la relación de una medida con otras medidas y características del funcionamiento del cual puede ser parte del concepto subyacente a la medida
Validez concurrente. La correlación de una medida con el rendimiento en otra medida o criterio en el mismo momento de tiempo.
Validez predictiva. La correlación de una medida en un punto en el tiempo con otra medición del rendimiento o criterio en algún momento del futuro.
Validez de criterio. Correlación de una medida con algún otro criterio. Esto puede abarcar la validez concurrente y la predictiva.
Validez aparente. El grado en el que una medida parece valorar el constructo de interés. Este no es un tipo formal de validación o parte de la investigación psicometrica o evaluación de la medida.
Validez convergente. El grado en el que dos medidas valoran constructos similares o relacionados. La validez de una medida dada sugiere si las medidas se correlacionan con otras, con las cuales se espera correlacionen, la correlación entre las medidas se espera con base en la coincidencia o relación de constructos, una forma de validez concurrente tiene significado en relación con la validez discriminante.
Validez discriminante. La correlación entre medidas que se espera que no se relacionen una con otra o que evalúen constructos diferentes  no relacionados. La validez de una medida dada se sugiere si la medida muestra poca o ninguna correlación con las medidas con las cuales no se espera que se correlacione. La ausencia de correlación se espera con base en diversos constructos conceptualmente diferenciados.
Estimación de la validez de construcción. Métodos intra-pruebas. Métodos inter-pruebas. Relaciones a criterios. Estudios de capacidad de generalización.

Contenu connexe

Tendances

Tecnicas e instrumentos de evaluacion psicologica
Tecnicas e instrumentos de evaluacion psicologicaTecnicas e instrumentos de evaluacion psicologica
Tecnicas e instrumentos de evaluacion psicologicaMRV25
 
Introducción a la Psicometría
Introducción a la PsicometríaIntroducción a la Psicometría
Introducción a la PsicometríaMarco Peña
 
Línea del tiempo sobre la historia del test.
Línea del tiempo sobre la historia del test.Línea del tiempo sobre la historia del test.
Línea del tiempo sobre la historia del test.Karen Ordóñez
 
Unidad II tema 1 Escalas de Medición
Unidad II tema 1 Escalas de MediciónUnidad II tema 1 Escalas de Medición
Unidad II tema 1 Escalas de MediciónCarla
 
Respuestas del Raven para adultos
Respuestas del Raven para adultosRespuestas del Raven para adultos
Respuestas del Raven para adultosRAISUKI
 
Naturaleza y uso de las pruebas psicológicas
Naturaleza y uso de las pruebas psicológicasNaturaleza y uso de las pruebas psicológicas
Naturaleza y uso de las pruebas psicológicasMariel Lopez Arias
 
Los instrumentos de medición y evaluación
Los instrumentos de medición y evaluaciónLos instrumentos de medición y evaluación
Los instrumentos de medición y evaluaciónGuadalupe Aguilar Aguila
 
Carlos alvarez mmpi-a (inventario multifásico de personalidad minnesota par...
Carlos alvarez   mmpi-a (inventario multifásico de personalidad minnesota par...Carlos alvarez   mmpi-a (inventario multifásico de personalidad minnesota par...
Carlos alvarez mmpi-a (inventario multifásico de personalidad minnesota par...IAPEM
 
Test de matrices progresivas (tres versiones1)
Test de matrices progresivas (tres versiones1)Test de matrices progresivas (tres versiones1)
Test de matrices progresivas (tres versiones1)Dario Ruiz
 

Tendances (20)

Psicometría
PsicometríaPsicometría
Psicometría
 
Tecnicas e instrumentos de evaluacion psicologica
Tecnicas e instrumentos de evaluacion psicologicaTecnicas e instrumentos de evaluacion psicologica
Tecnicas e instrumentos de evaluacion psicologica
 
Etapas de elaboracion de un test
Etapas de elaboracion de un testEtapas de elaboracion de un test
Etapas de elaboracion de un test
 
Teoría clásica de los test
Teoría clásica de los testTeoría clásica de los test
Teoría clásica de los test
 
Características y clasificación de los test
Características y clasificación de los testCaracterísticas y clasificación de los test
Características y clasificación de los test
 
Introducción a la Psicometría
Introducción a la PsicometríaIntroducción a la Psicometría
Introducción a la Psicometría
 
Pruebas de inteligencia .
Pruebas de inteligencia .Pruebas de inteligencia .
Pruebas de inteligencia .
 
Línea del tiempo sobre la historia del test.
Línea del tiempo sobre la historia del test.Línea del tiempo sobre la historia del test.
Línea del tiempo sobre la historia del test.
 
Unidad II tema 1 Escalas de Medición
Unidad II tema 1 Escalas de MediciónUnidad II tema 1 Escalas de Medición
Unidad II tema 1 Escalas de Medición
 
Respuestas del Raven para adultos
Respuestas del Raven para adultosRespuestas del Raven para adultos
Respuestas del Raven para adultos
 
Naturaleza y uso de las pruebas psicológicas
Naturaleza y uso de las pruebas psicológicasNaturaleza y uso de las pruebas psicológicas
Naturaleza y uso de las pruebas psicológicas
 
Los instrumentos de medición y evaluación
Los instrumentos de medición y evaluaciónLos instrumentos de medición y evaluación
Los instrumentos de medición y evaluación
 
PSICOMETRIA I
PSICOMETRIA IPSICOMETRIA I
PSICOMETRIA I
 
MEDICION EN PSICOLOGIA DE LA PERSONALIDAD.
MEDICION EN PSICOLOGIA DE LA PERSONALIDAD. MEDICION EN PSICOLOGIA DE LA PERSONALIDAD.
MEDICION EN PSICOLOGIA DE LA PERSONALIDAD.
 
Carlos alvarez mmpi-a (inventario multifásico de personalidad minnesota par...
Carlos alvarez   mmpi-a (inventario multifásico de personalidad minnesota par...Carlos alvarez   mmpi-a (inventario multifásico de personalidad minnesota par...
Carlos alvarez mmpi-a (inventario multifásico de personalidad minnesota par...
 
Test Individuales
Test IndividualesTest Individuales
Test Individuales
 
Evaluacion de la personalidad
Evaluacion de la personalidadEvaluacion de la personalidad
Evaluacion de la personalidad
 
Test de matrices progresivas (tres versiones1)
Test de matrices progresivas (tres versiones1)Test de matrices progresivas (tres versiones1)
Test de matrices progresivas (tres versiones1)
 
Fundamentos de la psicometría
Fundamentos de la psicometríaFundamentos de la psicometría
Fundamentos de la psicometría
 
Resumen La Medición en Psicología
Resumen La Medición en PsicologíaResumen La Medición en Psicología
Resumen La Medición en Psicología
 

Similaire à Psicometria

Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidadkarinaguzHM12
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidadkarinaguzHM12
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidadkarinaguzHM12
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidadmarieliz13
 
Validez y Confiablidad
Validez y ConfiablidadValidez y Confiablidad
Validez y ConfiablidadAllan Coll
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidadmarilin1224
 
Presentacion validez y confiabilidad
Presentacion validez y confiabilidadPresentacion validez y confiabilidad
Presentacion validez y confiabilidadroiderwizrodriguez
 
Validez y confiabilidad en la investigación
Validez y confiabilidad en la investigaciónValidez y confiabilidad en la investigación
Validez y confiabilidad en la investigacióngabo-187
 
Confiabilidad y validez en la elaboración de pruebas
Confiabilidad y validez en la elaboración de pruebasConfiabilidad y validez en la elaboración de pruebas
Confiabilidad y validez en la elaboración de pruebasacastillounah
 
Diseños cuantitativos de investigación
Diseños  cuantitativos  de investigaciónDiseños  cuantitativos  de investigación
Diseños cuantitativos de investigaciónUniversidad de YACAMBU
 
Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...
Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...
Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...Yennsilva
 

Similaire à Psicometria (20)

Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
Validez y Confiablidad
Validez y ConfiablidadValidez y Confiablidad
Validez y Confiablidad
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
Validez y Confiabilidad
Validez y ConfiabilidadValidez y Confiabilidad
Validez y Confiabilidad
 
Presentacion validez y confiabilidad
Presentacion validez y confiabilidadPresentacion validez y confiabilidad
Presentacion validez y confiabilidad
 
Validez y confiabilidad en la investigación
Validez y confiabilidad en la investigaciónValidez y confiabilidad en la investigación
Validez y confiabilidad en la investigación
 
Confiabilidad y validez en la elaboración de pruebas
Confiabilidad y validez en la elaboración de pruebasConfiabilidad y validez en la elaboración de pruebas
Confiabilidad y validez en la elaboración de pruebas
 
VALIDEZ Y CONFIABILIDAD
VALIDEZ Y CONFIABILIDADVALIDEZ Y CONFIABILIDAD
VALIDEZ Y CONFIABILIDAD
 
Diseños cuantitativos de investigación
Diseños  cuantitativos  de investigaciónDiseños  cuantitativos  de investigación
Diseños cuantitativos de investigación
 
Validez y confiabilidad 2014
Validez y confiabilidad 2014Validez y confiabilidad 2014
Validez y confiabilidad 2014
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
VALIDEZ Y CONFIABILIDAD
VALIDEZ Y CONFIABILIDADVALIDEZ Y CONFIABILIDAD
VALIDEZ Y CONFIABILIDAD
 
Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...
Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...
Validezyconfiabilidad por Yennifer Silva y Carlos Linero actividad de la unid...
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
Validez y confiabilidad
Validez y confiabilidadValidez y confiabilidad
Validez y confiabilidad
 
TRABAJO: VALIDEZ
TRABAJO: VALIDEZTRABAJO: VALIDEZ
TRABAJO: VALIDEZ
 

Plus de Gabriel Contreras Serrano

Optimizacion de preguntas abiertas via escalamiento multidimensional
Optimizacion de preguntas abiertas via escalamiento multidimensionalOptimizacion de preguntas abiertas via escalamiento multidimensional
Optimizacion de preguntas abiertas via escalamiento multidimensionalGabriel Contreras Serrano
 
Descripción de los desordenes del estado del animo
Descripción de los desordenes del estado del animoDescripción de los desordenes del estado del animo
Descripción de los desordenes del estado del animoGabriel Contreras Serrano
 
Depresión y experiencias adversas tempranas.
Depresión y experiencias adversas tempranas.Depresión y experiencias adversas tempranas.
Depresión y experiencias adversas tempranas.Gabriel Contreras Serrano
 

Plus de Gabriel Contreras Serrano (20)

Methodologies conjoint analysis
Methodologies   conjoint analysisMethodologies   conjoint analysis
Methodologies conjoint analysis
 
Sinnetic prefference mapping
Sinnetic   prefference mappingSinnetic   prefference mapping
Sinnetic prefference mapping
 
Optimizacion de preguntas abiertas via escalamiento multidimensional
Optimizacion de preguntas abiertas via escalamiento multidimensionalOptimizacion de preguntas abiertas via escalamiento multidimensional
Optimizacion de preguntas abiertas via escalamiento multidimensional
 
Sinnetic prefference mapping
Sinnetic   prefference mappingSinnetic   prefference mapping
Sinnetic prefference mapping
 
Necesidades psicológicas orgánicas.
Necesidades psicológicas orgánicas.Necesidades psicológicas orgánicas.
Necesidades psicológicas orgánicas.
 
Transporte hacia mitocondria
Transporte hacia mitocondriaTransporte hacia mitocondria
Transporte hacia mitocondria
 
Mitogen activated protein cinasa
Mitogen activated protein cinasaMitogen activated protein cinasa
Mitogen activated protein cinasa
 
Seminario
SeminarioSeminario
Seminario
 
Va r
Va rVa r
Va r
 
Path analysis with manifest variables
Path analysis with manifest variablesPath analysis with manifest variables
Path analysis with manifest variables
 
Dolor
DolorDolor
Dolor
 
Trastornos depresivos
Trastornos depresivosTrastornos depresivos
Trastornos depresivos
 
Patologias neurologicas
Patologias neurologicasPatologias neurologicas
Patologias neurologicas
 
Modelos de evaluación conductual general.
Modelos de evaluación conductual general.Modelos de evaluación conductual general.
Modelos de evaluación conductual general.
 
Formulacion conductual[1]
Formulacion conductual[1]Formulacion conductual[1]
Formulacion conductual[1]
 
Estres biopsicosocial
Estres biopsicosocialEstres biopsicosocial
Estres biopsicosocial
 
Desorden bipolar
Desorden bipolarDesorden bipolar
Desorden bipolar
 
Descripción de los desordenes del estado del animo
Descripción de los desordenes del estado del animoDescripción de los desordenes del estado del animo
Descripción de los desordenes del estado del animo
 
Desarrollo historico de la neuropsicologia
Desarrollo historico de la neuropsicologiaDesarrollo historico de la neuropsicologia
Desarrollo historico de la neuropsicologia
 
Depresión y experiencias adversas tempranas.
Depresión y experiencias adversas tempranas.Depresión y experiencias adversas tempranas.
Depresión y experiencias adversas tempranas.
 

Dernier

texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxKarlaMassielMartinez
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicaFlor Idalia Espinoza Ortega
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 

Dernier (20)

texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamica
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 

Psicometria

  • 1. Indicadores de calidad de un instrumento para evaluación por competencias. Carlos Gabriel Contreras S. Estadístico UCLA
  • 2. Agenda de trabajo. Confiabilidad. Validez.
  • 3. Confiabilidad. La confiabilidad (o consistencia) de un test es la precisión con que el test mide lo que mide, en una población determinada y en las condiciones normales de aplicación. (Anastasi, 1982; Aiken, 1995) (Las condiciones normales de aplicación se refieren a las condiciones especificadas en el manual del test).
  • 4. Confiabilidad. La falta de confiabilidad de un test psicométrico esta en relación con la intervención del error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados de la medición que influye sobre la falta de confiabilidad de tal medición.
  • 5. Error. El error es de dos tipos: a) Error constante (sistemático), que se produce cuando las mediciones que se obtienen con una escala son sistemáticamente mayores o menores que lo que realmente deben ser. b) Error causal (al azar o no sistemático), que se produce cuando las medidas son alternativamente mayores o menores de lo que realmente deben ser.
  • 6. Error causal. Interviene cuando se afecta la confiabilidad de un test psicométrico. Este error tiene que ver con la salud, fatiga, motivación, tensión emocional, fluctuaciones de la memoria, condiciones externas de luz, humedad, ventilación, calor, distracción por problemas del momento, familiaridad con la prueba, que presenta el examinado al momento de dar el test (Rey, 1972; Brown,1982)
  • 7. Representaciones estadísticas de la confiabilidad. Error estándar de medida. Coeficiente de confiabilidad.
  • 8. Coeficiente de confiabilidad. Es un coeficiente de correlación entre dos grupos de puntajes e indica el grado en que los individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1. Cuanto más se acerque el coeficiente a 1, más confiable será la prueba.
  • 9. Coeficiente de confiabilidad. El coeficiente de confiabilidad señala la cuantía en que las medidas del test están libres de errores casuales o no sistemáticos. Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas de aplicación del test el 95% de la varianza de los puntajes directos se debe a la auténtica medida, y sólo el 5%, a errores aleatorios.
  • 10. Obtención del coeficiente. Método de las formas equivalentes Método del test-retest Método de la división por mitades emparejadas o "splithalf method“ Método de la equivalencia racional o de Kuder-Richardson.
  • 11. Formas equivalentes. Se aplican dos formas equivalentes o paralelas del test al mismo grupo de individuos, y las dos series de puntajes resultantes se correlacionan con el coeficiente producto de los momentos de Pearson (r).
  • 12. Test Retest. Se aplica dos veces el mismo test (el lapso entre las aplicaciones se determina previamente), a una misma muestra de individuos. Las dos series de puntajes resultantes se correlacionan con el coeficiente de correlación "r" de Pearson.
  • 13. Split half Se aplica el test una sola vez a una muestra. Luego, se califica por separado los ítemes pares (2, 4, 6, ..., n) y los ítemes impares (1, 3, 5, ..., n). A continuación, las dos series de puntajes resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido el test en dos partes (ítemes pares e ítemes impares), el "r" resultante debe ser "corregido" para arrojar el "r“ para todo el test. Esta corrección se efectúa con la fórmula de profecía de Spearman-Brown:
  • 14. Equivalencia racional. Método de la equivalencia racional: En este método se considera que si un test esta formado por un conjunto de ítemes estos pueden ser considerados como un conjunto de tests paralelos (tantos como ítemes tenga el test). Luego se deriva una ecuación para computar el coeficiente de confiabilidad. Kuder y Richardson derivaron varias fórmulas para el cálculo del coeficiente de confiabilidad, son las más conocidas la KR20 y la KR21. Actualmente,un coeficiente más utilizado es el coeficiente alfa de Cronbach(1972; Anastasi, 1982; Aiken, 1995).
  • 15. Error estándar de medida. Por medio de este error estándar de medida se estima el intervalo probable de puntajes en el cual se encontrará el puntaje verdadero de un sujeto examinado con un test psicométrico.
  • 16. Error estándar de medida. s = Desviación estándar de los puntajes de la distribución. rxx = Coeficiente de confiabilidad del test. 1 = Constante. Obtenido el EEM, debemos escoger el nivel de confianza: - Nivel de confianza del 68% = PD ± 1 EEM. - Nivel de confianza del 95% = PD ± 2 EEM.
  • 17. EEM Para el nivel de confianza del 68% la interpretación es la siguiente: "Podemos concluir, con un 68% de confianza, que el puntaje verdadero de un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1 EEM". El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD) y ± 2 EEM"
  • 18. Validez. Si tenemos una prueba “X” nos equivocaríamos al creer que su titulo nos dice lo que la prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a obtener una medida, por ejemplo, de razonamiento numérico o de las estrategias de aprendizaje. La averiguación de lo que la prueba mide no responde a la pregunta ¿cómo llama el autor a la prueba?, sino más bien ¿a qué hacen referencia los puntajes obtenidos en esta?, ¿es válido el uso o la interpretación de las puntuaciones de este test?, ¿qué generalizaciones se pueden hacer apropiadamente a partir de la puntuación en esta prueba? (Thorndike, 1989).
  • 19. Distinción entre validez y confiabilidad. La distinción entre confiabilidad y validez se basa en lo que consideramos como error. En la validez interesan los errores constantes o sistemáticos y en la confiabilidad los errores aleatorios o no sistemáticos. El siguiente ejemplo nos permitirá precisar la diferencia entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se trata de un buen cronometro el tiempo que marca será confiable (es decir consecuente), pero no será valido en comparación con el tiempo estándar (hora GMT).
  • 20. Definición de validez En términos estadísticos la validez se define como la proporción de la varianza verdadera que es relevante para los fines del examen. Con el término relevante nos referimos a lo que es atribuible a la variable, características o dimensión que mide la prueba.
  • 21. Definición de validez. Generalmente la validez de un test se define ya sea por medio de (1) la relación entre sus puntuaciones con alguna medida de criterio externo, o bien (2) la extensión con la que la prueba mide un rasgo subyacente específico hipotético o “constructo”.
  • 22. Definición de validez. En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford, 1946, citado en Muñiz, 1996, p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los puntajes de las pruebas, que son función no sólo de los ítemes sino también de la forma de responder de las personas así como del contexto de la evaluación.
  • 23. Definición de validez Es decir, lo que se valida no es la prueba sino las inferencias hechas a partir de la misma, lo que tiene dos importantes consecuencias: a) el responsable de la validez de una prueba ya no es solo su constructor sino también el usuario, y b) la validez de una prueba no se establece de una vez por todas sino que es resultado del acopio de evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo que comprende todas las cuestiones
  • 24. En síntesis…. En este contexto, el concepto validez refiere a la adecuación, significado y utilidad de las inferencias específicas hechas con las puntuaciones del los tests.
  • 25. La validez no se puede resumir en un solo indicador o índice numérico, al igual que ocurre con la confiabilidad (p.e., el coeficiente de confiabilidad), sino que la validez de las puntuaciones de un test se asegura mediante la acumulación de evidencia teórica, estadística, empírica y conceptual del uso de las puntuaciones.
  • 26. Validez de contenido. ¿Los ítems que constituyen el test son realmente una muestra representativa del dominio de contenido o dominio conductual que nos interesa? La validez de contenido consiste en determinar lo adecuado del muestreo de reactivos del universo de reactivos posibles; en este sentido, es una “medida” de lo adecuado del muestreo.
  • 27. Validez de constructo. Grado en que la medida refleja el constructo. Se enfoca en la relación de una medida con otras medidas y características del funcionamiento del cual puede ser parte del concepto subyacente a la medida
  • 28. Validez concurrente. La correlación de una medida con el rendimiento en otra medida o criterio en el mismo momento de tiempo.
  • 29. Validez predictiva. La correlación de una medida en un punto en el tiempo con otra medición del rendimiento o criterio en algún momento del futuro.
  • 30. Validez de criterio. Correlación de una medida con algún otro criterio. Esto puede abarcar la validez concurrente y la predictiva.
  • 31. Validez aparente. El grado en el que una medida parece valorar el constructo de interés. Este no es un tipo formal de validación o parte de la investigación psicometrica o evaluación de la medida.
  • 32. Validez convergente. El grado en el que dos medidas valoran constructos similares o relacionados. La validez de una medida dada sugiere si las medidas se correlacionan con otras, con las cuales se espera correlacionen, la correlación entre las medidas se espera con base en la coincidencia o relación de constructos, una forma de validez concurrente tiene significado en relación con la validez discriminante.
  • 33. Validez discriminante. La correlación entre medidas que se espera que no se relacionen una con otra o que evalúen constructos diferentes no relacionados. La validez de una medida dada se sugiere si la medida muestra poca o ninguna correlación con las medidas con las cuales no se espera que se correlacione. La ausencia de correlación se espera con base en diversos constructos conceptualmente diferenciados.
  • 34. Estimación de la validez de construcción. Métodos intra-pruebas. Métodos inter-pruebas. Relaciones a criterios. Estudios de capacidad de generalización.