3. La medición es la forma como una serie de
observaciones sobre determinado tópico
pueden analizarse estadísticamente. El acopio
de la información por medio de una serie de
preguntas y su medición es un componente
básico de todos los diseños empleados en
investigación clínica y de campo. Cuando se
planea realizar un estudio hay que tener en
cuenta que al medir las observaciones se
juega con el error de medición.
5. El grado con que un instrumento representa lo
que intenta representar.
El grado con que el resultado de una medición
corresponden al verdadero estado de los
fenómenos que se están midiendo. Se
establece comparando el instrumento con un
patrón de referencia (gold standard)
6. Depende de los errores sistemáticos o sesgos
como:
• Observador
• Individuo
• Instrumento
La validez hace referencia a la posibilidad de
eficacia del instrumento de medición al
momento de utilizarlo y su pertinencia al
aplicarlo al fenómeno, hecho o sujeto de
estudio
8. Validez de contenido
Se refiere al grado en que el test presenta una
muestra adecuada de los contenidos a los que
se refiere, sin omisiones y sin desequilibrios
de contenido.
La validez de contenido se utiliza
principalmente con tests de rendimiento, y
especialmente con los tests educativos y tests
referidos al criterio. En este tipo de tests se
trata de comprobar los conocimientos respecto
a una materia o un curso.
9. Validez de Criterio
Se refiere al grado en que el test correlaciona
con variables ajenas al test (criterios) con lo
que se espera por hipótesis que debe
correlacionar de determinado modo. Un
criterio es una variable distinta del test que se
toma como referencia, que se sabe que es un
indicador de aquello que el test pretende
medir o que se sabe que debe presentar una
relación determinada con lo que el test
pretende medir.
10. Se denomina coeficiente de validez a la
correlación del test con un criterio externo.
Dentro del concepto de validez de criterio
cabe distinguir a su vez entre:
• Validez externa y validez interna
• Validez concurrente y validez predictiva
11. Validez de Constructo
Es el proceso científico de contrastación de
hipótesis, donde entraría tanto lo empírico
como los juicios racionales: las hipótesis
serían las inferencias realizadas a partir de las
puntuaciones de los test y la validación del
proceso de acumulación de videncias que
apoyen dichas inferencias, usos o
interpretaciones de las puntuaciones del test.
13. La confiabilidad se refiere al grado de
precisión o exactitud en la medida, en el
sentido de que si se aplica en forma repetida
el instrumento de medición al mismo sujeto u
objeto de estudio, debe de producir iguales
resultados.
Capacidad de un instrumento de no variar en
sus resultados, siendo utilizado por ya sea por
distintos observadores o en diferentes
momentos. Afectada por el error aleatorio
15. Test-Retest
La confiabilidad Test-Re-test consiste en la
aplicación del mismo instrumento a una
misma muestra de sujetos en dos o más
ocasiones, bajo condiciones similares, los
resultados de las pruebas repetidas son
entonces comparados, esta comparación es
expresada por el Coeficiente de correlación de
Pearson r.
16. El intervalo entre las administraciones
repetidas varía de acuerdo a la variable que
se está investigando58, no existe un criterio
único respecto a cuál debe ser el lapso
adecuado entre la primera y segunda
aplicación, la cantidad de tiempo sobre la cual
una variable es medida debe registrarse en el
reporte.
17. Formas Paralelas
A veces, por razones de índole práctica o
investigadora, se diseña un test y una
segunda versión del mismo, denominada
forma paralela, que intenta evaluar o medir lo
mismo que el test original pero con diferentes
ítems. Dos versiones o formas se consideran
paralelas si, aplicadas a una misma muestra
de personas, obtienen medias y varianzas
probabilísticamente similares.
18. La correlación de Pearson entre las
puntuaciones obtenidas en una misma
muestra en dos formas paralelas se considera
el coeficiente de fiabilidad de cualquiera de
ellas, e indicará el grado en que pueden
considerarse equivalentes
19. Split-Halves
Involucra dividir una
escala en dos mitades
para hacer una
comparación, las mitades
pueden ser de números
impares o incluso una
simple división desde la
primera a la segunda
mitad o los ítem pueden
ser una selección
aleatoria en dos mitades
para ser analizadas una
con la otra.
20. Las mitades divididas proveen una medida de
consistencia en términos de ejemplos del
contenido, los contenidos de las dos mitades
de la prueba se asumen para ser comparables
y el coeficiente de confiabilidad es calculado,
si los resultados para las dos mitades son
aproximadamente iguales las pruebas podrán
ser consideradas confiables, la formula de
Spearman-Brown es un método usado para
calcular el coeficiente de confiabilidad.
21. Coeficiente alfa de Cronbach
El coeficiente alfa de Cronbach es el modo
mas habitual de estimar la confiabilidad de
pruebas basadas en teoría clásica de los test.
Es decir, es un procedimiento que sirve para
calcular la confiabilidad y validez de los
instrumentos.
22. Para poder validar el test realizado es
necesario aplicar como mínimo a una cantidad
de individuos a 5 veces al el numero de ítems
a efectos de evitar obtener correlaciones ítem-total
espuriamente altas, que pueden aparecer
cuando el numero de ítems y el de individuos
que responden la prueba son semejantes.
23. Coeficiente KR-20
El KR20 es un indicador de la fidelidad
(consistencia interna). Los métodos basados
(Rulon, Alfa de Cronbach, Spearman, Brown) en
la división en dos porciones (presumiblemente
iguales) da desventaja de ser relacionado con las
opciones de la partición (véase la mitad igualdad-impar,
de la primera y segunda parte, al azar).
Kuder y Richardson desarrollaron un
procedimiento basado en los resultados obtenidos
con cada ítem. De hecho, hay muchas maneras
de precisar otra vez los ítems (reactivos) en 2
grupos, que pueden conducir a las estimaciones
diferentes de la consistencia interna.
24. Es el estimado de homogeneidad usado para
instrumentos que tienen formatos de
respuestas dicotómicas, (Si - No o Falso -
Verdadero), la técnica se establece en una
correlación que es basada sobre la
consistencia de respuestas a todos los ítems
de un test que es administrado una vez. El
mínimo aceptable del puntaje de KR-20 es
0.70.