Este documento describe un estudio que examinó la relación entre los niveles de cortisol en la sangre y en las heces de 17 ejemplares de roedor O. degus. Se realizó un análisis de regresión lineal que mostró una dependencia estadísticamente significativa entre las variables, lo que sugiere que los niveles de cortisol en la sangre podrían predecir los niveles en las heces. Esto valida el uso del cortisol fecal para estimar el estrés en especies silvestres.
1. FACULTAD DE CIENCIAS BIOLÓGICAS, BIO-242C BIOESTADÍSTICA, 2008
PRUEBA 2
Pregunta 1 (11 puntos). En estudios de especies silvestres en peligro es frecuente estimar el nivel
de stress de los individuos a factores ambientales a partir del nivel de la hormona cortisol en la
sangre. Dada la dificultad de obtener muestras de sangre en estudios en terreno, se ha planteado
que el nivel de cortisol también podría ser estimado a partir de las heces, las que son más fáciles de
obtener y menos invasivas. Para poder estimar los niveles de cortisol en base a las heces es
necesario demostrar que los niveles de cortisol en la sangre afectan los niveles de esta hormona en
las heces. El Prof. Mauricio Soto midió los niveles de cortisol en la sangre (ng mL-1) y en las heces
(ng g heces-1) a 17 ejemplares del roedor O. degus. El Prof. Mauricio Soto decidió realizar un análisis
de regresión lineal simple y los datos están en la Figura 1.
(a) Agregue el nombre y unidades a los ejes (2 puntos); (b) (3 puntos) indique en el espacio a la
derecha de la figura si es necesario agregar algún otro elemento para completar la figura (justifique
por qué si o no); de ser así, agréguelo a la figura. Se trata de un análisis de regresión que involucra
una dependencia matemática lineal entre las dos variables. Por lo tanto se debe mostrar la línea de
regresión del modelo que está detrás.
600
Cortisol heces (ng g heces )
-1
500
400
300
200
R2 = 0.559
100 P = 0.0005
0
0 400 800 1200 1600 2000
-1
Cortisol sangre (ng mL )
(c) (3 puntos) Indique cuál sería la conclusión biológica que el Prof. Soto debería extraer luego de
este análisis; indique sobre qué información se basaría esta conclusión.
El análisis sugiere una dependencia matemática lineal estadísticamente significativa (P<0,05) entre
las variables, lo que indica que el cortisol en la sangre es un buen predictor del cortisol en las heces.
Esto, por lo tanto da validez a la idea de utilizar el cortisol fecal para estimar el stress en especies en
peligro en su ambiente natural.
(d) (3 puntos) Explique qué señala el valor de R de la figura 1 en este caso e indique si sería más
adecuado o no indicar el valor al cuadrado de R. De ser así, indique por qué.
R indica el tipo (positiva o negativa) y grado de correlación entre las dos variables examinadas. Por lo
tanto, es más apropiado reportar el valor de R2 por que este indica el % de la variación en cortisol
fecal que es explicado por variaciones en el cortisol de la sangre bajo el supuesto de un modelo
matemático lineal usado en el análisis de regresión usado.
2. Pregunta 2 (15 puntos). Cuando el Prof. Soto intentó publicar sus resultados, descritos en la
pregunta 1, un revisor anónimo lo criticó e indicó que era necesario que realizara un análisis de
residuos. Ansioso por responder a esta crítica, el Prof. Soto realizó el análisis adicional y los
resultados aparecen en la Figura 2.
(cortisol heces obs - cortisol heces esp)
200
Figura 2
150
100
50
Residuos
0
-50
-100
R=0,01
-150 P=0,98
-200
0 200 400 600 800 1000 1200 1400 1600 1800
-1
Cortisol sangre (ng mL )
(a) Agregue el nombre y unidades a ambos ejes (3 puntos)
(b) (4 puntos) explique en qué consiste y para qué sirve un análisis de residuos, y por lo tanto qué
argumento habría usado el revisor anónimo para solicitar al Prof. Soto un análisis como este.
El análisis de residuos consiste en realizar una regresión entre la variable independiente (X) original y
las diferencias entre los valores observados y esperados (por la línea de regresión) de la variable
respuesta (dependiente). Se utiliza para determinar el supuesto del análisis de regresión de acuerdo
al cual los errores observados en Y son homogéneos (constantes) a lo largo del rango de valores
medidos de X.
El revisor simplemente considero que este supuesto del análisis de regresión podría no haberse
cumplido en el análisis del Prof. Soto.
(c) (4 puntos) En base a los resultados del análisis de residuos realizado, cuál sería la conclusión
estadística y argumento final del Prof. Soto al momento de responder a la crítica del revisor anónimo.
La observación de que el valor de P observado es muy superior a 0,05 indica que no existe una
relación matemática significativa entre la variable independiente y los residuos de la variable
dependiente. Esto sugiere que los residuos no cambian a lo largo del rango de valores medidos de X
y que el supuesto de homogeneidad de los errores se cumple.
(d) (4 puntos) Suponga ahora que el Prof. Soto hubiese encontrado que los valores de R y P fuesen
0,86 y 0,02 respectivamente. Tendría el Prof. Soto que modificar el análisis inicial realizado entre el
cortisol de la sangre y las heces. De ser así indique por qué e indique al menos dos alternativas que
usted crea apropiadas.
Si, pues ello indicaría que los residuos (la diferencia entre el valor de Y observado y la recta)
aumentan a valores más grandes de X en forma significativa. Las alternativas incluyen (i) transformar
los datos (e.g., usando logaritmo) seguido del mismo análisis de regresión lineal; (ii) utilizar un
modelo de regresión no lineal.
2
3. Pregunta 3 (12 puntos). Una segunda crítica realizada al Prof. Soto y su estudio de validación del
uso de cortisol en las heces por parte de este revisor anónimo fue que el hecho de que algunos
animales (n = 5) podrían haber estado reproductivamente activos mientras que otros no, algo que
podría haber afectado los resultados. Ya que el Prof. Soto nunca reprobó el BIO 242C, ayúdelo (a) (3
puntos) indicando qué análisis sería el más adecuado en este caso. Además, indique claramente
cómo usaría las variables en este caso.
(a) La manera de examinar esto es un ANCOVA donde el cortisol en las heces sigue siendo la
variable respuesta, pero el cortisol en la sangre es ahora una covariable; el estado reproductivo (dos
niveles) sería un factor discreto
Suponga que un arranque de creatividad el Prof. Soto examinó los datos y encontró lo siguiente:
Fuente de variación SC GL CM F obs P
A: Estado reproductivo 2424,30 1 2424,30 0,22 0,646
B: Cortisol sangre 73572,30 1 73572,30 6,72 0,022
AxB 9109,60 1 9109,60 0,83 0,378
Error 142289,50 13 10945,35
(b) (2 puntos) Identifique las fuentes de variación en la tabla, suponiendo que el análisis del Prof.
Soto no apoya la crítica del revisor.
En la Figura 3 se muestran los datos originales del Prof. Soto, pero esta vez tomando en cuenta el
estado reproductivo de los animales.
600
Reproductivos
Cortisol heces (ng g heces )
No reproductivos
-1
500
400
300
200
100
0
0 400 800 1200 1600 2000
-1
Cortisol sangre (ng mL )
(c) (3 puntos) rotule la leyenda de los puntos y agregue cualquier elemento que falte para completar
la figura 3, de acuerdo a los antecedentes que ya conoce de este estudio. Tomando en cuenta los
resultados estadísticos anteriores, (d) (4 puntos) indique qué puede concluir sobre la relación
matemática entre los niveles de cortisol en la sangre y heces, en animales con distinta condición
reproductiva (nota: justifique esto con fundamentos estadísticos claros y precisos).
(c) Los puntos negros corresponden a los animales reproductivos; las líneas de regresión en este
caso deberían dibujarse paralelas debido a que este factor no tiene efecto. (d) Dado que el análisis
indica un efecto de la covariable (cortisol en la sangre) pero no una interacción con el estado
reproductivo, el efecto de los niveles de cortisol en la sangre sobre los niveles de cortisol en las heces
no es afectado por el estado reproductivo de los animales estudiados.
3
4. Pregunta 4 (18 puntos). Un estudio tuvo como objetivo principal evaluar el efecto de la
estacionalidad climática (a través de sus efectos sobre la vegetación) sobre el tiempo asignado por
un roedor a forrajeo, vigilancia erguida (posado sobre las extremidades posteriores) y vigilancia
simple (posado sobre las cuatro extremidades). Para ello, y para cada animal observado se registró el
porcentaje de tiempo que estos estuvieron realizando cada una de estas tres actividades, en cuatro
estaciones distintas y a lo largo de dos años (Nota: suponga que los animales registrados en distintas
estaciones son también diferentes).
(a) (4 puntos) Justifique estadística y biológicamente la prueba estadística (o procedimiento) que
utilizaría, cómo incluiría cada variable en el análisis, y si podría ser necesario realizar algún tipo de
ajuste o modificación a los datos antes del análisis.
Biológicamente, es muy claro que las variables respuesta medidas podrían estar relacionadas pues el
tiempo que el animal destina a una actividad podría aumentar o disminuir el tiempo que destina a las
otras. Esto implica que análisis por separado para cada variable aumentaría la posibilidad de cometer
error tipo I. La solución entonces es MANOVA de modo que las variables tiempo de forrajeo, tiempo
de vigilancia erguida y vigilancia simple serían tres variables respuesta. La estacionalidad sería el
único factor, en este caso con 4 niveles. Por último, dado que los datos corresponden a %, podría ser
necesario su transformación usando la transformación arcoseno de la raíz cuadrada.
Consultado el Prof. Soto, a quien usted ayudó, este ahora le recomendó un curso de acción y cuyos
resultados están a continuación.
Fuente de variación SC GL CM F obs F crítico
Estadígrafo F observado F crítico
Variable respuesta: Forrajeo
Wilks 0,82 1,608 1,93 A: Estacionalidad 145,10 3 48,37 0,22 2,73
Pillai's 0,18 1,581 1,92 Error 16609,80 74 224,46
Hotelling 0,21 1,622 1,92 Fuente de variación SC GL CM F obs F crítico
Roy's 0,17 4,225 2,73 Variable respuesta: Vigilancia erguida
A: Estacionalidad 946,49 3 315,50 3,84 2,73
Error 6074,88 74 82,09
Fuente de variación SC GL CM F obs F crítico
Variable respuesta: Vigilancia simple
A: Estacionalidad 233,40 3 77,80 0,65 2,73
Error 8805,68 74 119,00
(b) (3 puntos) Explique la recomendación del Prof. Soto, particularmente por qué, a juzgar por el
número de tablas, realizó 4 análisis en este caso.
El MANOVA inicial solo permite apreciar si el factor (estacionalidad) tiene algún efecto en al menos
una de las variables repuesta examinadas. Por lo tanto, y dado que al manos uno de los estadígrafos
del MANOVA sugiere un efecto, es necesario realizar ANOVAS para cada variable por separado para
determinar qué variables estarían siendo afectadas por la estacionalidad.
(c) (2 puntos) Suponiendo que la recomendación del Prof. Soto sea la correcta, complete los
términos que faltan en las tablas anteriores.
4
5. El Prof. Soto. sostiene además que para el análisis realizado antes es importante determinar la
posible correlación entre las variables estudiadas. Los valores de R y P para cada correlación
examinada están en la siguiente tabla.
Correlación examinada Valor de R Valor de P
Forrajeo vs. vigilancia erguida -0,13 0,270
Forrajeo vs. vigilancia simple -0,61 0,001
Vigilancia erguida vs. vigilancia erguida -0,05 0,624
(d) (3 puntos) Explique con fundamentos claros por qué el Prof. Soto estaría tan interesado en
evaluar estas correlaciones.
Debido a que un supuesto importante del MANOVA es que las varianzas y covarianzas entre las
variables respuesta examinadas deben ser iguales (homogéneas). El incumplimiento de este
supuesto afecta algunos estadígrafos del MANOVA, particularmente el de Roy, lo que podría
entonces afectar las conclusiones del análisis.
(e) (6 puntos) Indique entonces cuáles serían las conclusiones estadística y biológica finales que se
pueden extraer luego de considerar los análisis realizados por el Prof. Soto.
Estadística (4/6 puntos):
A pesar de que el MANOVA indica un efecto sobre al manos una de las variables examinadas, ello se
debe a un valor significativo para el estadígrafo de Roy. Dado que las correlaciones entre las
variables no son similares, el supuesto de homogeneidad de varianzas y covarianzas probablemente
no se cumple. En estas circunstancias no es posible entonces “confiar” en el estadígrafo de Roy. Ya
que los otros tres estadígrafos del MANOVA indican que no hay efecto de la estacionalidad, debemos
optar entonces por no rechazar la hipótesis nula inicial.
Biológica (2/6 puntos):
Por lo tanto, no hay evidencia que indique que la estacionalidad afecta el tiempo asignado por estos
roedores a forrajear, vigilar en forma simple o erguida.
Pregunta 5 (14 puntos). Darwin planteó la hipótesis de que la fertilización cruzada (entre plantas
distintas) proporciona mayores beneficios reproductivos comparado con la auto-fertilización. Dado
que el riesgo potencial de auto-fertilización aumenta con el tamaño de las plantas (mayor en árboles,
intermedio en arbustos, bajo en hierbas), sería esperable entonces una relación entre el sistema floral
y el tamaño de las plantas. No solo eso, en plantas grandes como los árboles sería esperable una
mayor ocurrencia de flores masculinas y femeninas separados en individuos distintos (especies
dioicas). Un estudio examinó la flora nativa de la isla de Tasmania y contabilizó la ocurrencia de
especies dioicas, monoicas (flores masculinas y femeninas distintas pero en una misma planta) y
hermafroditas (flores con partes femeninas y masculinas juntas en un mismo individuo). Los
resultados fueron los siguientes: 19 hierbas dioicas; 102 hierbas monoicas; 379 hierbas
hermafroditas; 31 arbustos dioicos, 30 arbustos monoicos, 88 arbustos hermafroditas; 12 árboles
dioicos; 40 árboles monoicos; 56 árboles hermafroditas.
(a) (4 puntos) Explique brevemente el análisis estadístico que debe realizar, indicando cómo usaría
5
6. las variables y número de niveles en cada una para evaluar la hipótesis de Darwin con estos datos.
No olvide indicar claramente la hipótesis nula.
Se requiere examinar una relación entre el tamaño de las plantas (variable independiente con tres
niveles o categorías) y el sistema floral (variable dependiente con tres niveles o categorías) mediante
una tabla de contingencia por tratarse de variables discretas. La hipótesis nula es no hay una relación
entre ambas variables, o que el sistema floral es independiente del tamaño de las plantas.
(b) Utilice este espacio que sigue para calcular el valor observado de la estadística apropiada en este
caso (utilice la más conocida) (5 puntos), cómo derivaría el valor esperado (= 9,49 en este caso; 1
punto), e indique la conclusión estadística en este caso (1 punto).
Tamaño Sistema floral
Total Fi
Dioico Monoico Hermafrodita
Observado
Hierbas 19 102 379 500
Arbustos 31 30 88 149
Árboles 12 40 56 108
Total Ci 62 172 523 757
Esperado
Hierbas 41 114 345 500
Arbustos 12 34 103 149
Árboles 9 25 75 108
Total Ci 62 172 523 757
Obs-Esp -21,95 -11,61 33,56
Obs-Esp 18,80 -3,85 -14,94
Obs-Esp 3,15 15,46 -18,62
2
(Obs-Esp) 481,85 134,71 1126,10
2
(Obs-Esp) 353,31 14,86 223,26
2
(Obs-Esp) 9,95 239,04 346,54
2
(Obs-Esp) /Esp 11,77 1,19 3,26
2
(Obs-Esp) /Esp 28,95 0,44 2,17
2
(Obs-Esp) /Esp 1,13 9,74 4,64
Valor observado de chi-cuadrado = 63,28
Valor crítico de chi-cuadrado para alfa de 0,05 y 4 gl = 9,49
Conclusión estadística: existe una asociación significativa entre el tamaño de las plantas y el
sistema floral
(c) En base resultado final y a los cálculos realizados, indique si la hipótesis de Darwin es o no
correcta y si las predicciones planteadas inicialmente son válidas (3 puntos).
Primero, la dependencia estadística entre el tamaño y el sistema floral indica que ambas variables
6
7. están relacionadas, lo que concuerda con la predicción general de la hipótesis de Darwin (1 punto).
En cuanto a la predicción específica de una mayor frecuencia de especies dioicas en plantas
grandes, esto también se cumple si se observa que la frecuencia de árboles dioicos es mayor que lo
esperado (desvíos positivos). A la inversa, la frecuencia de árboles hermafroditas es menor que lo
esperado (desvíos negativos) (2 puntos)
7