SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
FACULTAD DE CIENCIAS BIOLÓGICAS, BIO-242C BIOESTADÍSTICA, 2008
                                                                  PRUEBA 2


Pregunta 1 (11 puntos). En estudios de especies silvestres en peligro es frecuente estimar el nivel
de stress de los individuos a factores ambientales a partir del nivel de la hormona cortisol en la
sangre. Dada la dificultad de obtener muestras de sangre en estudios en terreno, se ha planteado
que el nivel de cortisol también podría ser estimado a partir de las heces, las que son más fáciles de
obtener y menos invasivas. Para poder estimar los niveles de cortisol en base a las heces es
necesario demostrar que los niveles de cortisol en la sangre afectan los niveles de esta hormona en
las heces. El Prof. Mauricio Soto midió los niveles de cortisol en la sangre (ng mL-1) y en las heces
(ng g heces-1) a 17 ejemplares del roedor O. degus. El Prof. Mauricio Soto decidió realizar un análisis
de regresión lineal simple y los datos están en la Figura 1.

(a) Agregue el nombre y unidades a los ejes (2 puntos); (b) (3 puntos) indique en el espacio a la
derecha de la figura si es necesario agregar algún otro elemento para completar la figura (justifique
por qué si o no); de ser así, agréguelo a la figura. Se trata de un análisis de regresión que involucra
una dependencia matemática lineal entre las dos variables. Por lo tanto se debe mostrar la línea de
regresión del modelo que está detrás.

                               600
Cortisol heces (ng g heces )
-1




                               500


                               400


                               300


                               200

                                                                            R2 = 0.559
                               100                                          P = 0.0005

                                 0
                                     0      400        800      1200         1600        2000
                                                                       -1
                                                  Cortisol sangre (ng mL )

(c) (3 puntos) Indique cuál sería la conclusión biológica que el Prof. Soto debería extraer luego de
este análisis; indique sobre qué información se basaría esta conclusión.

El análisis sugiere una dependencia matemática lineal estadísticamente significativa (P<0,05) entre
las variables, lo que indica que el cortisol en la sangre es un buen predictor del cortisol en las heces.
Esto, por lo tanto da validez a la idea de utilizar el cortisol fecal para estimar el stress en especies en
peligro en su ambiente natural.

(d) (3 puntos) Explique qué señala el valor de R de la figura 1 en este caso e indique si sería más
adecuado o no indicar el valor al cuadrado de R. De ser así, indique por qué.

R indica el tipo (positiva o negativa) y grado de correlación entre las dos variables examinadas. Por lo
tanto, es más apropiado reportar el valor de R2 por que este indica el % de la variación en cortisol
fecal que es explicado por variaciones en el cortisol de la sangre bajo el supuesto de un modelo
matemático lineal usado en el análisis de regresión usado.
Pregunta 2 (15 puntos). Cuando el Prof. Soto intentó publicar sus resultados, descritos en la
pregunta 1, un revisor anónimo lo criticó e indicó que era necesario que realizara un análisis de
residuos. Ansioso por responder a esta crítica, el Prof. Soto realizó el análisis adicional y los
resultados aparecen en la Figura 2.
(cortisol heces obs - cortisol heces esp)




                                            200
                                                                                             Figura 2
                                            150

                                            100

                                             50
                Residuos




                                              0

                                             -50

                                            -100
                                                                                              R=0,01
                                            -150                                              P=0,98

                                            -200
                                                   0   200   400   600   800 1000 1200 1400 1600 1800
                                                                                        -1
                                                             Cortisol sangre (ng mL )

(a) Agregue el nombre y unidades a ambos ejes (3 puntos)

(b) (4 puntos) explique en qué consiste y para qué sirve un análisis de residuos, y por lo tanto qué
argumento habría usado el revisor anónimo para solicitar al Prof. Soto un análisis como este.

El análisis de residuos consiste en realizar una regresión entre la variable independiente (X) original y
las diferencias entre los valores observados y esperados (por la línea de regresión) de la variable
respuesta (dependiente). Se utiliza para determinar el supuesto del análisis de regresión de acuerdo
al cual los errores observados en Y son homogéneos (constantes) a lo largo del rango de valores
medidos de X.

El revisor simplemente considero que este supuesto del análisis de regresión podría no haberse
cumplido en el análisis del Prof. Soto.

(c) (4 puntos) En base a los resultados del análisis de residuos realizado, cuál sería la conclusión
estadística y argumento final del Prof. Soto al momento de responder a la crítica del revisor anónimo.

La observación de que el valor de P observado es muy superior a 0,05 indica que no existe una
relación matemática significativa entre la variable independiente y los residuos de la variable
dependiente. Esto sugiere que los residuos no cambian a lo largo del rango de valores medidos de X
y que el supuesto de homogeneidad de los errores se cumple.

(d) (4 puntos) Suponga ahora que el Prof. Soto hubiese encontrado que los valores de R y P fuesen
0,86 y 0,02 respectivamente. Tendría el Prof. Soto que modificar el análisis inicial realizado entre el
cortisol de la sangre y las heces. De ser así indique por qué e indique al menos dos alternativas que
usted crea apropiadas.

Si, pues ello indicaría que los residuos (la diferencia entre el valor de Y observado y la recta)
aumentan a valores más grandes de X en forma significativa. Las alternativas incluyen (i) transformar
los datos (e.g., usando logaritmo) seguido del mismo análisis de regresión lineal; (ii) utilizar un
modelo de regresión no lineal.




                                                                                                        2
Pregunta 3 (12 puntos). Una segunda crítica realizada al Prof. Soto y su estudio de validación del
uso de cortisol en las heces por parte de este revisor anónimo fue que el hecho de que algunos
animales (n = 5) podrían haber estado reproductivamente activos mientras que otros no, algo que
podría haber afectado los resultados. Ya que el Prof. Soto nunca reprobó el BIO 242C, ayúdelo (a) (3
puntos) indicando qué análisis sería el más adecuado en este caso. Además, indique claramente
cómo usaría las variables en este caso.

(a) La manera de examinar esto es un ANCOVA donde el cortisol en las heces sigue siendo la
variable respuesta, pero el cortisol en la sangre es ahora una covariable; el estado reproductivo (dos
niveles) sería un factor discreto


Suponga que un arranque de creatividad el Prof. Soto examinó los datos y encontró lo siguiente:

Fuente de variación                                                              SC          GL     CM       F obs    P

A: Estado reproductivo                                                     2424,30           1    2424,30    0,22    0,646
B: Cortisol sangre                                                        73572,30           1    73572,30   6,72    0,022
AxB                                                                        9109,60           1    9109,60    0,83    0,378
Error                                                                    142289,50           13   10945,35

(b) (2 puntos) Identifique las fuentes de variación en la tabla, suponiendo que el análisis del Prof.
Soto no apoya la crítica del revisor.

En la Figura 3 se muestran los datos originales del Prof. Soto, pero esta vez tomando en cuenta el
estado reproductivo de los animales.
                               600
                                         Reproductivos
Cortisol heces (ng g heces )




                                         No reproductivos
-1




                               500


                               400


                               300


                               200


                               100


                                0
                                     0      400             800   1200        1600    2000
                                                                         -1
                                                  Cortisol sangre (ng mL )


(c) (3 puntos) rotule la leyenda de los puntos y agregue cualquier elemento que falte para completar
la figura 3, de acuerdo a los antecedentes que ya conoce de este estudio. Tomando en cuenta los
resultados estadísticos anteriores, (d) (4 puntos) indique qué puede concluir sobre la relación
matemática entre los niveles de cortisol en la sangre y heces, en animales con distinta condición
reproductiva (nota: justifique esto con fundamentos estadísticos claros y precisos).

(c) Los puntos negros corresponden a los animales reproductivos; las líneas de regresión en este
caso deberían dibujarse paralelas debido a que este factor no tiene efecto. (d) Dado que el análisis
indica un efecto de la covariable (cortisol en la sangre) pero no una interacción con el estado
reproductivo, el efecto de los niveles de cortisol en la sangre sobre los niveles de cortisol en las heces
no es afectado por el estado reproductivo de los animales estudiados.




                                                                                              3
Pregunta 4 (18 puntos). Un estudio tuvo como objetivo principal evaluar el efecto de la
estacionalidad climática (a través de sus efectos sobre la vegetación) sobre el tiempo asignado por
un roedor a forrajeo, vigilancia erguida (posado sobre las extremidades posteriores) y vigilancia
simple (posado sobre las cuatro extremidades). Para ello, y para cada animal observado se registró el
porcentaje de tiempo que estos estuvieron realizando cada una de estas tres actividades, en cuatro
estaciones distintas y a lo largo de dos años (Nota: suponga que los animales registrados en distintas
estaciones son también diferentes).

(a) (4 puntos) Justifique estadística y biológicamente la prueba estadística (o procedimiento) que
utilizaría, cómo incluiría cada variable en el análisis, y si podría ser necesario realizar algún tipo de
ajuste o modificación a los datos antes del análisis.

Biológicamente, es muy claro que las variables respuesta medidas podrían estar relacionadas pues el
tiempo que el animal destina a una actividad podría aumentar o disminuir el tiempo que destina a las
otras. Esto implica que análisis por separado para cada variable aumentaría la posibilidad de cometer
error tipo I. La solución entonces es MANOVA de modo que las variables tiempo de forrajeo, tiempo
de vigilancia erguida y vigilancia simple serían tres variables respuesta. La estacionalidad sería el
único factor, en este caso con 4 niveles. Por último, dado que los datos corresponden a %, podría ser
necesario su transformación usando la transformación arcoseno de la raíz cuadrada.

Consultado el Prof. Soto, a quien usted ayudó, este ahora le recomendó un curso de acción y cuyos
resultados están a continuación.

                                            Fuente de variación          SC          GL    CM      F obs   F crítico
   Estadígrafo     F observado F crítico
                                            Variable respuesta: Forrajeo

Wilks       0,82      1,608        1,93     A: Estacionalidad           145,10        3   48,37    0,22      2,73
Pillai's    0,18      1,581        1,92     Error                      16609,80      74   224,46
Hotelling   0,21      1,622        1,92     Fuente de variación            SC        GL    CM      F obs   F crítico
Roy's       0,17      4,225        2,73     Variable respuesta: Vigilancia erguida

                                            A: Estacionalidad          946,49         3   315,50   3,84      2,73
                                            Error                      6074,88       74   82,09

                                            Fuente de variación            SC        GL    CM      F obs   F crítico
                                            Variable respuesta: Vigilancia simple

                                            A: Estacionalidad          233,40         3   77,80    0,65      2,73
                                            Error                      8805,68       74   119,00

(b) (3 puntos) Explique la recomendación del Prof. Soto, particularmente por qué, a juzgar por el
número de tablas, realizó 4 análisis en este caso.

El MANOVA inicial solo permite apreciar si el factor (estacionalidad) tiene algún efecto en al menos
una de las variables repuesta examinadas. Por lo tanto, y dado que al manos uno de los estadígrafos
del MANOVA sugiere un efecto, es necesario realizar ANOVAS para cada variable por separado para
determinar qué variables estarían siendo afectadas por la estacionalidad.

(c) (2 puntos) Suponiendo que la recomendación del Prof. Soto sea la correcta, complete los
términos que faltan en las tablas anteriores.




                                                       4
El Prof. Soto. sostiene además que para el análisis realizado antes es importante determinar la
posible correlación entre las variables estudiadas. Los valores de R y P para cada correlación
examinada están en la siguiente tabla.

Correlación examinada                       Valor de R    Valor de P
Forrajeo vs. vigilancia erguida               -0,13         0,270
Forrajeo vs. vigilancia simple                -0,61         0,001
Vigilancia erguida vs. vigilancia erguida     -0,05         0,624

(d) (3 puntos) Explique con fundamentos claros por qué el Prof. Soto estaría tan interesado en
evaluar estas correlaciones.

Debido a que un supuesto importante del MANOVA es que las varianzas y covarianzas entre las
variables respuesta examinadas deben ser iguales (homogéneas). El incumplimiento de este
supuesto afecta algunos estadígrafos del MANOVA, particularmente el de Roy, lo que podría
entonces afectar las conclusiones del análisis.

(e) (6 puntos) Indique entonces cuáles serían las conclusiones estadística y biológica finales que se
pueden extraer luego de considerar los análisis realizados por el Prof. Soto.

Estadística (4/6 puntos):

A pesar de que el MANOVA indica un efecto sobre al manos una de las variables examinadas, ello se
debe a un valor significativo para el estadígrafo de Roy. Dado que las correlaciones entre las
variables no son similares, el supuesto de homogeneidad de varianzas y covarianzas probablemente
no se cumple. En estas circunstancias no es posible entonces “confiar” en el estadígrafo de Roy. Ya
que los otros tres estadígrafos del MANOVA indican que no hay efecto de la estacionalidad, debemos
optar entonces por no rechazar la hipótesis nula inicial.

Biológica (2/6 puntos):

Por lo tanto, no hay evidencia que indique que la estacionalidad afecta el tiempo asignado por estos
roedores a forrajear, vigilar en forma simple o erguida.




Pregunta 5 (14 puntos). Darwin planteó la hipótesis de que la fertilización cruzada (entre plantas
distintas) proporciona mayores beneficios reproductivos comparado con la auto-fertilización. Dado
que el riesgo potencial de auto-fertilización aumenta con el tamaño de las plantas (mayor en árboles,
intermedio en arbustos, bajo en hierbas), sería esperable entonces una relación entre el sistema floral
y el tamaño de las plantas. No solo eso, en plantas grandes como los árboles sería esperable una
mayor ocurrencia de flores masculinas y femeninas separados en individuos distintos (especies
dioicas). Un estudio examinó la flora nativa de la isla de Tasmania y contabilizó la ocurrencia de
especies dioicas, monoicas (flores masculinas y femeninas distintas pero en una misma planta) y
hermafroditas (flores con partes femeninas y masculinas juntas en un mismo individuo). Los
resultados fueron los siguientes: 19 hierbas dioicas; 102 hierbas monoicas; 379 hierbas
hermafroditas; 31 arbustos dioicos, 30 arbustos monoicos, 88 arbustos hermafroditas; 12 árboles
dioicos; 40 árboles monoicos; 56 árboles hermafroditas.

(a) (4 puntos) Explique brevemente el análisis estadístico que debe realizar, indicando cómo usaría
                                                      5
las variables y número de niveles en cada una para evaluar la hipótesis de Darwin con estos datos.
No olvide indicar claramente la hipótesis nula.

Se requiere examinar una relación entre el tamaño de las plantas (variable independiente con tres
niveles o categorías) y el sistema floral (variable dependiente con tres niveles o categorías) mediante
una tabla de contingencia por tratarse de variables discretas. La hipótesis nula es no hay una relación
entre ambas variables, o que el sistema floral es independiente del tamaño de las plantas.

(b) Utilice este espacio que sigue para calcular el valor observado de la estadística apropiada en este
caso (utilice la más conocida) (5 puntos), cómo derivaría el valor esperado (= 9,49 en este caso; 1
punto), e indique la conclusión estadística en este caso (1 punto).

Tamaño                        Sistema floral
                                                          Total Fi
                    Dioico    Monoico Hermafrodita

Observado

Hierbas                19        102          379           500
Arbustos               31        30           88            149
Árboles                12        40           56            108

Total Ci               62        172          523           757

Esperado

Hierbas                41        114          345           500
Arbustos               12        34           103           149
Árboles                9         25           75            108

Total Ci               62        172          523           757

Obs-Esp              -21,95    -11,61        33,56
Obs-Esp              18,80      -3,85       -14,94
Obs-Esp               3,15      15,46       -18,62

           2
(Obs-Esp)            481,85    134,71       1126,10
         2
(Obs-Esp)            353,31     14,86       223,26
         2
(Obs-Esp)             9,95     239,04       346,54

           2
(Obs-Esp) /Esp       11,77      1,19         3,26
         2
(Obs-Esp) /Esp       28,95      0,44         2,17
         2
(Obs-Esp) /Esp        1,13      9,74         4,64


Valor observado de chi-cuadrado = 63,28
Valor crítico de chi-cuadrado para alfa de 0,05 y 4 gl = 9,49

Conclusión estadística: existe una asociación significativa entre el tamaño de las plantas y el
sistema floral


(c) En base resultado final y a los cálculos realizados, indique si la hipótesis de Darwin es o no
correcta y si las predicciones planteadas inicialmente son válidas (3 puntos).

Primero, la dependencia estadística entre el tamaño y el sistema floral indica que ambas variables
                                                      6
están relacionadas, lo que concuerda con la predicción general de la hipótesis de Darwin (1 punto).
En cuanto a la predicción específica de una mayor frecuencia de especies dioicas en plantas
grandes, esto también se cumple si se observa que la frecuencia de árboles dioicos es mayor que lo
esperado (desvíos positivos). A la inversa, la frecuencia de árboles hermafroditas es menor que lo
esperado (desvíos negativos) (2 puntos)




                                                 7

Más contenido relacionado

Destacado

Fórum - Poder Local e Ordenamento do Território
Fórum - Poder Local e Ordenamento do TerritórioFórum - Poder Local e Ordenamento do Território
Fórum - Poder Local e Ordenamento do Territóriojsribatejo
 
Límites y autonomía (circular informativa)
Límites y autonomía (circular informativa)Límites y autonomía (circular informativa)
Límites y autonomía (circular informativa)rociohdezglez
 
My magazine idea, Shhh
My magazine idea, ShhhMy magazine idea, Shhh
My magazine idea, Shhhdaisyhall_
 
Colegio francisco antonio zea de usme
Colegio francisco antonio zea de usmeColegio francisco antonio zea de usme
Colegio francisco antonio zea de usmeDiana Jimenez
 
Clasificacion de los modelos
Clasificacion de los modelosClasificacion de los modelos
Clasificacion de los modelosRosario lloglla
 
Construção do modelo teórico
Construção do modelo teóricoConstrução do modelo teórico
Construção do modelo teóricoSandra Pereira
 
Modelos culturales monografía (powerpoint) clase dr. acosta
Modelos culturales monografía (powerpoint) clase dr. acostaModelos culturales monografía (powerpoint) clase dr. acosta
Modelos culturales monografía (powerpoint) clase dr. acostagarycherry06
 
Pesquisa metodologia 2
Pesquisa metodologia 2Pesquisa metodologia 2
Pesquisa metodologia 2Moises Ribeiro
 
Características de los modelos teóricos
Características de los modelos teóricosCaracterísticas de los modelos teóricos
Características de los modelos teóricosLaura Moreno
 
¿Qué es un modelo teórico?
¿Qué es un modelo teórico?¿Qué es un modelo teórico?
¿Qué es un modelo teórico?beeere99
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologiaJoao Balbi
 
Metodologia do Trabalho cientifico
Metodologia do Trabalho cientificoMetodologia do Trabalho cientifico
Metodologia do Trabalho cientificorenatacopi
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologiaJoao Balbi
 
Meu pré projeto joiara nara
Meu pré projeto joiara naraMeu pré projeto joiara nara
Meu pré projeto joiara narajoiramara
 
Metodologia do Projeto
Metodologia do ProjetoMetodologia do Projeto
Metodologia do Projetoguest67a8da
 
Lista de verbos para projeto de pesquisa
Lista de verbos para projeto de pesquisaLista de verbos para projeto de pesquisa
Lista de verbos para projeto de pesquisamarildabacana
 

Destacado (19)

Fórum - Poder Local e Ordenamento do Território
Fórum - Poder Local e Ordenamento do TerritórioFórum - Poder Local e Ordenamento do Território
Fórum - Poder Local e Ordenamento do Território
 
Límites y autonomía (circular informativa)
Límites y autonomía (circular informativa)Límites y autonomía (circular informativa)
Límites y autonomía (circular informativa)
 
My magazine idea, Shhh
My magazine idea, ShhhMy magazine idea, Shhh
My magazine idea, Shhh
 
2acuerdos
2acuerdos2acuerdos
2acuerdos
 
Colegio francisco antonio zea de usme
Colegio francisco antonio zea de usmeColegio francisco antonio zea de usme
Colegio francisco antonio zea de usme
 
Clasificacion de los modelos
Clasificacion de los modelosClasificacion de los modelos
Clasificacion de los modelos
 
Construção do modelo teórico
Construção do modelo teóricoConstrução do modelo teórico
Construção do modelo teórico
 
Modelos culturales monografía (powerpoint) clase dr. acosta
Modelos culturales monografía (powerpoint) clase dr. acostaModelos culturales monografía (powerpoint) clase dr. acosta
Modelos culturales monografía (powerpoint) clase dr. acosta
 
Pesquisa metodologia 2
Pesquisa metodologia 2Pesquisa metodologia 2
Pesquisa metodologia 2
 
Características de los modelos teóricos
Características de los modelos teóricosCaracterísticas de los modelos teóricos
Características de los modelos teóricos
 
Modelos culturales
Modelos culturalesModelos culturales
Modelos culturales
 
¿Qué es un modelo teórico?
¿Qué es un modelo teórico?¿Qué es un modelo teórico?
¿Qué es un modelo teórico?
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
 
Modelos
ModelosModelos
Modelos
 
Metodologia do Trabalho cientifico
Metodologia do Trabalho cientificoMetodologia do Trabalho cientifico
Metodologia do Trabalho cientifico
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
 
Meu pré projeto joiara nara
Meu pré projeto joiara naraMeu pré projeto joiara nara
Meu pré projeto joiara nara
 
Metodologia do Projeto
Metodologia do ProjetoMetodologia do Projeto
Metodologia do Projeto
 
Lista de verbos para projeto de pesquisa
Lista de verbos para projeto de pesquisaLista de verbos para projeto de pesquisa
Lista de verbos para projeto de pesquisa
 

I2

  • 1. FACULTAD DE CIENCIAS BIOLÓGICAS, BIO-242C BIOESTADÍSTICA, 2008 PRUEBA 2 Pregunta 1 (11 puntos). En estudios de especies silvestres en peligro es frecuente estimar el nivel de stress de los individuos a factores ambientales a partir del nivel de la hormona cortisol en la sangre. Dada la dificultad de obtener muestras de sangre en estudios en terreno, se ha planteado que el nivel de cortisol también podría ser estimado a partir de las heces, las que son más fáciles de obtener y menos invasivas. Para poder estimar los niveles de cortisol en base a las heces es necesario demostrar que los niveles de cortisol en la sangre afectan los niveles de esta hormona en las heces. El Prof. Mauricio Soto midió los niveles de cortisol en la sangre (ng mL-1) y en las heces (ng g heces-1) a 17 ejemplares del roedor O. degus. El Prof. Mauricio Soto decidió realizar un análisis de regresión lineal simple y los datos están en la Figura 1. (a) Agregue el nombre y unidades a los ejes (2 puntos); (b) (3 puntos) indique en el espacio a la derecha de la figura si es necesario agregar algún otro elemento para completar la figura (justifique por qué si o no); de ser así, agréguelo a la figura. Se trata de un análisis de regresión que involucra una dependencia matemática lineal entre las dos variables. Por lo tanto se debe mostrar la línea de regresión del modelo que está detrás. 600 Cortisol heces (ng g heces ) -1 500 400 300 200 R2 = 0.559 100 P = 0.0005 0 0 400 800 1200 1600 2000 -1 Cortisol sangre (ng mL ) (c) (3 puntos) Indique cuál sería la conclusión biológica que el Prof. Soto debería extraer luego de este análisis; indique sobre qué información se basaría esta conclusión. El análisis sugiere una dependencia matemática lineal estadísticamente significativa (P<0,05) entre las variables, lo que indica que el cortisol en la sangre es un buen predictor del cortisol en las heces. Esto, por lo tanto da validez a la idea de utilizar el cortisol fecal para estimar el stress en especies en peligro en su ambiente natural. (d) (3 puntos) Explique qué señala el valor de R de la figura 1 en este caso e indique si sería más adecuado o no indicar el valor al cuadrado de R. De ser así, indique por qué. R indica el tipo (positiva o negativa) y grado de correlación entre las dos variables examinadas. Por lo tanto, es más apropiado reportar el valor de R2 por que este indica el % de la variación en cortisol fecal que es explicado por variaciones en el cortisol de la sangre bajo el supuesto de un modelo matemático lineal usado en el análisis de regresión usado.
  • 2. Pregunta 2 (15 puntos). Cuando el Prof. Soto intentó publicar sus resultados, descritos en la pregunta 1, un revisor anónimo lo criticó e indicó que era necesario que realizara un análisis de residuos. Ansioso por responder a esta crítica, el Prof. Soto realizó el análisis adicional y los resultados aparecen en la Figura 2. (cortisol heces obs - cortisol heces esp) 200 Figura 2 150 100 50 Residuos 0 -50 -100 R=0,01 -150 P=0,98 -200 0 200 400 600 800 1000 1200 1400 1600 1800 -1 Cortisol sangre (ng mL ) (a) Agregue el nombre y unidades a ambos ejes (3 puntos) (b) (4 puntos) explique en qué consiste y para qué sirve un análisis de residuos, y por lo tanto qué argumento habría usado el revisor anónimo para solicitar al Prof. Soto un análisis como este. El análisis de residuos consiste en realizar una regresión entre la variable independiente (X) original y las diferencias entre los valores observados y esperados (por la línea de regresión) de la variable respuesta (dependiente). Se utiliza para determinar el supuesto del análisis de regresión de acuerdo al cual los errores observados en Y son homogéneos (constantes) a lo largo del rango de valores medidos de X. El revisor simplemente considero que este supuesto del análisis de regresión podría no haberse cumplido en el análisis del Prof. Soto. (c) (4 puntos) En base a los resultados del análisis de residuos realizado, cuál sería la conclusión estadística y argumento final del Prof. Soto al momento de responder a la crítica del revisor anónimo. La observación de que el valor de P observado es muy superior a 0,05 indica que no existe una relación matemática significativa entre la variable independiente y los residuos de la variable dependiente. Esto sugiere que los residuos no cambian a lo largo del rango de valores medidos de X y que el supuesto de homogeneidad de los errores se cumple. (d) (4 puntos) Suponga ahora que el Prof. Soto hubiese encontrado que los valores de R y P fuesen 0,86 y 0,02 respectivamente. Tendría el Prof. Soto que modificar el análisis inicial realizado entre el cortisol de la sangre y las heces. De ser así indique por qué e indique al menos dos alternativas que usted crea apropiadas. Si, pues ello indicaría que los residuos (la diferencia entre el valor de Y observado y la recta) aumentan a valores más grandes de X en forma significativa. Las alternativas incluyen (i) transformar los datos (e.g., usando logaritmo) seguido del mismo análisis de regresión lineal; (ii) utilizar un modelo de regresión no lineal. 2
  • 3. Pregunta 3 (12 puntos). Una segunda crítica realizada al Prof. Soto y su estudio de validación del uso de cortisol en las heces por parte de este revisor anónimo fue que el hecho de que algunos animales (n = 5) podrían haber estado reproductivamente activos mientras que otros no, algo que podría haber afectado los resultados. Ya que el Prof. Soto nunca reprobó el BIO 242C, ayúdelo (a) (3 puntos) indicando qué análisis sería el más adecuado en este caso. Además, indique claramente cómo usaría las variables en este caso. (a) La manera de examinar esto es un ANCOVA donde el cortisol en las heces sigue siendo la variable respuesta, pero el cortisol en la sangre es ahora una covariable; el estado reproductivo (dos niveles) sería un factor discreto Suponga que un arranque de creatividad el Prof. Soto examinó los datos y encontró lo siguiente: Fuente de variación SC GL CM F obs P A: Estado reproductivo 2424,30 1 2424,30 0,22 0,646 B: Cortisol sangre 73572,30 1 73572,30 6,72 0,022 AxB 9109,60 1 9109,60 0,83 0,378 Error 142289,50 13 10945,35 (b) (2 puntos) Identifique las fuentes de variación en la tabla, suponiendo que el análisis del Prof. Soto no apoya la crítica del revisor. En la Figura 3 se muestran los datos originales del Prof. Soto, pero esta vez tomando en cuenta el estado reproductivo de los animales. 600 Reproductivos Cortisol heces (ng g heces ) No reproductivos -1 500 400 300 200 100 0 0 400 800 1200 1600 2000 -1 Cortisol sangre (ng mL ) (c) (3 puntos) rotule la leyenda de los puntos y agregue cualquier elemento que falte para completar la figura 3, de acuerdo a los antecedentes que ya conoce de este estudio. Tomando en cuenta los resultados estadísticos anteriores, (d) (4 puntos) indique qué puede concluir sobre la relación matemática entre los niveles de cortisol en la sangre y heces, en animales con distinta condición reproductiva (nota: justifique esto con fundamentos estadísticos claros y precisos). (c) Los puntos negros corresponden a los animales reproductivos; las líneas de regresión en este caso deberían dibujarse paralelas debido a que este factor no tiene efecto. (d) Dado que el análisis indica un efecto de la covariable (cortisol en la sangre) pero no una interacción con el estado reproductivo, el efecto de los niveles de cortisol en la sangre sobre los niveles de cortisol en las heces no es afectado por el estado reproductivo de los animales estudiados. 3
  • 4. Pregunta 4 (18 puntos). Un estudio tuvo como objetivo principal evaluar el efecto de la estacionalidad climática (a través de sus efectos sobre la vegetación) sobre el tiempo asignado por un roedor a forrajeo, vigilancia erguida (posado sobre las extremidades posteriores) y vigilancia simple (posado sobre las cuatro extremidades). Para ello, y para cada animal observado se registró el porcentaje de tiempo que estos estuvieron realizando cada una de estas tres actividades, en cuatro estaciones distintas y a lo largo de dos años (Nota: suponga que los animales registrados en distintas estaciones son también diferentes). (a) (4 puntos) Justifique estadística y biológicamente la prueba estadística (o procedimiento) que utilizaría, cómo incluiría cada variable en el análisis, y si podría ser necesario realizar algún tipo de ajuste o modificación a los datos antes del análisis. Biológicamente, es muy claro que las variables respuesta medidas podrían estar relacionadas pues el tiempo que el animal destina a una actividad podría aumentar o disminuir el tiempo que destina a las otras. Esto implica que análisis por separado para cada variable aumentaría la posibilidad de cometer error tipo I. La solución entonces es MANOVA de modo que las variables tiempo de forrajeo, tiempo de vigilancia erguida y vigilancia simple serían tres variables respuesta. La estacionalidad sería el único factor, en este caso con 4 niveles. Por último, dado que los datos corresponden a %, podría ser necesario su transformación usando la transformación arcoseno de la raíz cuadrada. Consultado el Prof. Soto, a quien usted ayudó, este ahora le recomendó un curso de acción y cuyos resultados están a continuación. Fuente de variación SC GL CM F obs F crítico Estadígrafo F observado F crítico Variable respuesta: Forrajeo Wilks 0,82 1,608 1,93 A: Estacionalidad 145,10 3 48,37 0,22 2,73 Pillai's 0,18 1,581 1,92 Error 16609,80 74 224,46 Hotelling 0,21 1,622 1,92 Fuente de variación SC GL CM F obs F crítico Roy's 0,17 4,225 2,73 Variable respuesta: Vigilancia erguida A: Estacionalidad 946,49 3 315,50 3,84 2,73 Error 6074,88 74 82,09 Fuente de variación SC GL CM F obs F crítico Variable respuesta: Vigilancia simple A: Estacionalidad 233,40 3 77,80 0,65 2,73 Error 8805,68 74 119,00 (b) (3 puntos) Explique la recomendación del Prof. Soto, particularmente por qué, a juzgar por el número de tablas, realizó 4 análisis en este caso. El MANOVA inicial solo permite apreciar si el factor (estacionalidad) tiene algún efecto en al menos una de las variables repuesta examinadas. Por lo tanto, y dado que al manos uno de los estadígrafos del MANOVA sugiere un efecto, es necesario realizar ANOVAS para cada variable por separado para determinar qué variables estarían siendo afectadas por la estacionalidad. (c) (2 puntos) Suponiendo que la recomendación del Prof. Soto sea la correcta, complete los términos que faltan en las tablas anteriores. 4
  • 5. El Prof. Soto. sostiene además que para el análisis realizado antes es importante determinar la posible correlación entre las variables estudiadas. Los valores de R y P para cada correlación examinada están en la siguiente tabla. Correlación examinada Valor de R Valor de P Forrajeo vs. vigilancia erguida -0,13 0,270 Forrajeo vs. vigilancia simple -0,61 0,001 Vigilancia erguida vs. vigilancia erguida -0,05 0,624 (d) (3 puntos) Explique con fundamentos claros por qué el Prof. Soto estaría tan interesado en evaluar estas correlaciones. Debido a que un supuesto importante del MANOVA es que las varianzas y covarianzas entre las variables respuesta examinadas deben ser iguales (homogéneas). El incumplimiento de este supuesto afecta algunos estadígrafos del MANOVA, particularmente el de Roy, lo que podría entonces afectar las conclusiones del análisis. (e) (6 puntos) Indique entonces cuáles serían las conclusiones estadística y biológica finales que se pueden extraer luego de considerar los análisis realizados por el Prof. Soto. Estadística (4/6 puntos): A pesar de que el MANOVA indica un efecto sobre al manos una de las variables examinadas, ello se debe a un valor significativo para el estadígrafo de Roy. Dado que las correlaciones entre las variables no son similares, el supuesto de homogeneidad de varianzas y covarianzas probablemente no se cumple. En estas circunstancias no es posible entonces “confiar” en el estadígrafo de Roy. Ya que los otros tres estadígrafos del MANOVA indican que no hay efecto de la estacionalidad, debemos optar entonces por no rechazar la hipótesis nula inicial. Biológica (2/6 puntos): Por lo tanto, no hay evidencia que indique que la estacionalidad afecta el tiempo asignado por estos roedores a forrajear, vigilar en forma simple o erguida. Pregunta 5 (14 puntos). Darwin planteó la hipótesis de que la fertilización cruzada (entre plantas distintas) proporciona mayores beneficios reproductivos comparado con la auto-fertilización. Dado que el riesgo potencial de auto-fertilización aumenta con el tamaño de las plantas (mayor en árboles, intermedio en arbustos, bajo en hierbas), sería esperable entonces una relación entre el sistema floral y el tamaño de las plantas. No solo eso, en plantas grandes como los árboles sería esperable una mayor ocurrencia de flores masculinas y femeninas separados en individuos distintos (especies dioicas). Un estudio examinó la flora nativa de la isla de Tasmania y contabilizó la ocurrencia de especies dioicas, monoicas (flores masculinas y femeninas distintas pero en una misma planta) y hermafroditas (flores con partes femeninas y masculinas juntas en un mismo individuo). Los resultados fueron los siguientes: 19 hierbas dioicas; 102 hierbas monoicas; 379 hierbas hermafroditas; 31 arbustos dioicos, 30 arbustos monoicos, 88 arbustos hermafroditas; 12 árboles dioicos; 40 árboles monoicos; 56 árboles hermafroditas. (a) (4 puntos) Explique brevemente el análisis estadístico que debe realizar, indicando cómo usaría 5
  • 6. las variables y número de niveles en cada una para evaluar la hipótesis de Darwin con estos datos. No olvide indicar claramente la hipótesis nula. Se requiere examinar una relación entre el tamaño de las plantas (variable independiente con tres niveles o categorías) y el sistema floral (variable dependiente con tres niveles o categorías) mediante una tabla de contingencia por tratarse de variables discretas. La hipótesis nula es no hay una relación entre ambas variables, o que el sistema floral es independiente del tamaño de las plantas. (b) Utilice este espacio que sigue para calcular el valor observado de la estadística apropiada en este caso (utilice la más conocida) (5 puntos), cómo derivaría el valor esperado (= 9,49 en este caso; 1 punto), e indique la conclusión estadística en este caso (1 punto). Tamaño Sistema floral Total Fi Dioico Monoico Hermafrodita Observado Hierbas 19 102 379 500 Arbustos 31 30 88 149 Árboles 12 40 56 108 Total Ci 62 172 523 757 Esperado Hierbas 41 114 345 500 Arbustos 12 34 103 149 Árboles 9 25 75 108 Total Ci 62 172 523 757 Obs-Esp -21,95 -11,61 33,56 Obs-Esp 18,80 -3,85 -14,94 Obs-Esp 3,15 15,46 -18,62 2 (Obs-Esp) 481,85 134,71 1126,10 2 (Obs-Esp) 353,31 14,86 223,26 2 (Obs-Esp) 9,95 239,04 346,54 2 (Obs-Esp) /Esp 11,77 1,19 3,26 2 (Obs-Esp) /Esp 28,95 0,44 2,17 2 (Obs-Esp) /Esp 1,13 9,74 4,64 Valor observado de chi-cuadrado = 63,28 Valor crítico de chi-cuadrado para alfa de 0,05 y 4 gl = 9,49 Conclusión estadística: existe una asociación significativa entre el tamaño de las plantas y el sistema floral (c) En base resultado final y a los cálculos realizados, indique si la hipótesis de Darwin es o no correcta y si las predicciones planteadas inicialmente son válidas (3 puntos). Primero, la dependencia estadística entre el tamaño y el sistema floral indica que ambas variables 6
  • 7. están relacionadas, lo que concuerda con la predicción general de la hipótesis de Darwin (1 punto). En cuanto a la predicción específica de una mayor frecuencia de especies dioicas en plantas grandes, esto también se cumple si se observa que la frecuencia de árboles dioicos es mayor que lo esperado (desvíos positivos). A la inversa, la frecuencia de árboles hermafroditas es menor que lo esperado (desvíos negativos) (2 puntos) 7