SlideShare une entreprise Scribd logo
1  sur  41
FUNDAMENTOS DE
INVESTIGACIÓN
(estadística
inferencial)
Iban Ginto
2021-2022
TIPOS DE
VARIABLES
Tipos de variables:
● Cualquier investigación suele exigir una fase de recogida de datos. A partir de ellos se
calculan otros números, los índices estadísticos, que extraen la información
importante contenida en los datos.
● A las cualidades o cantidades recogidas de cada individuo se les llama variables,
porque pueden variar de un sujeto a otro, a diferencia de las constantes.
● Resulta básico distinguir los diferentes tipos de variables según las escalas que se
usen para medirlas.
Tipos de variables: variables cualitativas/categóricas
nominales:
Son variables en las que cada categoría o valor corresponde a una característica o cualidad que la
persona posee. Los posibles valores son excluyentes (mujer-hombre, color de ojos, todas las variables
cuyo valor pueda ser un sí o un no, etc.).
Para su medición usamos escalas nominales, donde los valores se identifican con palabras. Una escala
nominal sólo permite clasificar, pero no ordenar o jerarquizar. Únicamente se permiten operaciones de
igualdad o desigualdad. Los posibles valores de una escala nominal podrían representarse con letras (A,
B, C...). Puede decirse que la clase A es distinta de la B, pero no que sea mayor o menor.
1= mujer, 2= hombre (2 no es, en este caso, el doble de 1; son mutuamente excluyentes)
*Si hay una posible gradación o jerarquización de los valores o categorías (unos son mayores que otros),
entonces la escala no es nominal, sino ordinal.
Tipos de variables: variables cualitativas/categóricas
nominales:
Las variables cualitativas o categóricas nominales pueden ser:
● Dicotómicas o binarias: si sólo admiten dos categorías.
- Sano/enfermo, expuesto/no expuesto, hombre/mujer, etc.
● Policotómicas: con varias categorías.
- Grupo sanguíneo (A/B/0/AB), cierto tipo de tratamiento (A/B/C), estado civil, etc.
Tipos de variables: variables cualitativas ordinales:
● Son aquellas cuyos posibles valores se encuentran jerarquizados y ordenados. El tipo de
escala utilizado se denomina ordinal.
● Con estas variables se pueden realizar no solo operaciones de igualdad y desigualdad, sino
también operaciones de orden (jerarquizar los diferentes valores).
● Están en una situación intermedia (entre las cualitativas y las cuantitativas). Se trata, por
ejemplo, del interés en dejar de fumar (interés). En este tipo de variables se puede decir que
un grado 2 de interés es más intenso que un grado 1, pero nunca puede interpretarse como
que tener un código 2 implique exactamente el doble de interés que el 1.
Tipos de variables: variables cuantitativas:
● Hablamos de variables cuantitativas cuando los números utilizados para expresarlas equivalen realmente con exactitud a los
verdaderos datos. Los datos son realmente numéricos.
1= mujer, 2=hombre Edad= 1, 2, 3, etc.
Hay dos tipos:
-Discretas: sus valores son finitos y coinciden con números enteros (Nº de hijos, Nº de intentos de dejar de fumar, etc.).
- Continuas: permiten todas las operaciones hasta ahora comentadas y se miden en escala de razón*. Pueden adoptar valores con
decimales (peso, edad, talla, etc.).
*Los datos de escala de razón se definen como un tipo de datos cuantitativos que se caracterizan por un punto de cero absoluto, lo
que significa que no hay ningún valor numérico negativo.
MEDIDAS DE TENDENCIA CENTRAL
Medidas de tendencia central:
● Media aritmética:
Cuando se habla del «promedio» o de «la media» sin más especificaciones, siempre se trata de la
media aritmética. Es la suma de todos los valores (xi ) dividida por el número de observaciones
(n). La media de la población se expresa como μ y la media de una muestra, como x
̄ .
Medidas de tendencia central:
● Media geométrica:
La media geométrica suele usarse poco habitualmente, pero a veces resulta útil, por ejemplo, en
microbiología, ya que las variables que se manejan suelen crecer exponencialmente.
El símbolo que aparece dentro de la raíz (∏, una letra griega pi mayúscula) es el multiplicatorio y
significa que hay que multiplicar uno por otro todos los valores de la variable. La raíz no es una
raíz cuadrada, sino una raíz n-ésima, siendo n el tamaño de muestra. Una raíz cuadrada es la raíz
2, una raíz cúbica es la raíz 3. Eso es lo que significa la n en el superíndice junto al símbolo de
raíz. La media geométrica de los valores 1, 2 y 3 sería la raíz cúbica del producto de 1 × 2 × 3.
Medidas de tendencia central:
● Media armónica:
También se utiliza poco, pero tiene aplicaciones en farmacología. Se dice que tanto la media
geométrica como la media armónica son estimadores de tendencia central más robustos que la
media aritmética: esto significa que se dejan influir menos por valores raros o extremos.
Se calcula dividiendo el número de observaciones por la suma del inverso de cada valor.
Medidas de tendencia central:
● Media ponderada:
Se utiliza mucho.
Por ejemplo: supongamos que un alumno ha obtenido las siguientes calificaciones en la asignatura
«Bioestadística» de primero de medicina:
Pruebas de clase: 8. Prácticas: 10. Examen final: 4.
Si a las prácticas y a las pruebas de clase se les da un peso del 25%, y al examen final del 50%, ¿cuál será la
media ponderada? Si llamamos wi a los pesos:
Medidas de tendencia central:
● Mediana:
Puede definirse como el valor central del conjunto ordenado de observaciones; es decir, el valor que deja la
mitad de las observaciones por debajo y la mitad por encima.
Cuando el número de datos es par, para hallar la mediana se calcula la media entre los dos datos centrales.
Medidas de tendencia central:
● Mediana:
La mediana es una medida de tendencia central que es robusta. Esto significa, por ejemplo, que si la mujer de mayor
edad tuviese 100 años, la mediana seguiría siendo 49. En cambio, la media aritmética subiría de 43,8 a 50,7.
Por tanto, la mediana es la medida de tendencia central que se usará cuando en muestras pequeñas haya alguna
observación extrema («outlier») o cuando existan datos truncados o «censurados». Se dice que la mediana es robusta
porque no se deja influir mucho por valores extremos.
Sin embargo, tiene un inconveniente, y es que no se usan todos los valores observados para calcularla, sino solo el valor
central o los dos valores centrales.
Medidas de tendencia central:
● Moda:
La moda tiene poco interés. Es el valor más frecuente.
MEDIDAS DE DISPERSIÓN
Medidas de dispersión: varianza:
Para resumir unos datos no basta con decir cuál es su centro, sino que también hay que indicar en qué medida están
juntos o separados de ese valor central. A esta característica se le llama dispersión. Cuanto más separados estén
unos datos del valor central, más dispersos serán. La dispersión expresa el grado de variabilidad de unas
observaciones.
Por tanto, para resumir la información que hay en un conjunto de datos no basta con decir cuál es su media (u otra
medida de tendencia central). Es preciso indicar también su variabilidad o dispersión.
Por ejemplo:
Medidas de dispersión: desviación
típica/estándar:
Para resumir la información que hay en un conjunto de datos no basta con decir cuál es su media (u otra medida de
tendencia central). Es preciso indicar también su variabilidad o dispersión. Cuanto más separados estén los valores
de la media, mayor será su dispersión. La desviación típica/estándar es una medida de dispersión.
Medidas de dispersión: desviación
típica/estándar:
Para resumir la información que hay en un conjunto de datos no basta con decir cuál es su media (u otra medida de
tendencia central). Es preciso indicar también su variabilidad o dispersión. Cuanto más separados estén los valores
de la media, mayor será su dispersión. La desviación típica/estándar es una medida de dispersión.
Medidas de dispersión: coeficiente de variación:
Supongamos que la media de una variable vale 10 y su desviación estándar vale 5. Podríamos decir que la desviación
estándar supone el 50% de la media (la mitad de los sujetos medios se encuentran entre los valores de la desviación
estándar). A esta razón o cociente entre la desviación estándar y el valor de la media aritmética se le llama coeficiente de
variación.
Para poder conocer si los valores de una variable están dispersos o concentrados e incluso comparar la dispersión de diversas
variables, se usa el coeficiente de variación. Por ejemplo:
A= 3, 11, 22, 34, 47, 66, 73, 84, 101 B= 47, 48, 48, 49, 49, 49, 49, 51, 51
En el ejemplo A el coeficiente de variación es del 69,97%, mientras que en el ejemplo B es del 2,7%. De este modo, se aprecia
claramente que la distribución de A es más dispersa que la de B.
Medidas de dispersión: error estándar de la
media:
No se debe confundir error estándar con desviación estándar. La desviación estándar mide el grado de dispersión de
los individuos que forman la muestra. En cambio, el error estándar de la media medirá el grado de dispersión de las
medias de todas las posibles muestras de tamaño n que pudieran extraerse de la población. Por ejemplo:
A= 3, 11, 22, 34, 47, 66, 73, 84, 101 B= 47, 48, 48, 49, 49, 49, 49, 51, 51
La desviación estándar del grupo A vale 34,1 y la del grupo B 1,3. Esta desviación estándar estima la distancia media
a la que se encuentra cada uno de los 9 individuos estudiados respecto del valor medio de la edad del grupo (en
ambos casos es 49). En cambio, el error estándar estima la desviación típica de un grupo imaginario formado por las
medias de las posibles muestras de tamaño 9 que se pueden obtener de la población de la que procede la muestra.
Por tanto, el error estándar es el error estándar de la media.
OTROS CONCEPTOS
Otros conceptos: estadístico/estimador muestral:
Para cada característica evaluada, se obtendrán o más valores numéricos que se conocen como estadísticos o
estimadores muestrales (medidas de tendencia central, de variabilidad, etc.).
Será a partir de estos estadísticos obtenidos en la muestra (lo concreto) a través de los cuales tendremos que
realizar afirmaciones sobre los valores de los parámetros de la población.
En cada una de las muestras obtenidas de la población, se realizará la medición de las variables de interés y se
obtendrá un estadístico. El valor del estadístico será diferente (o igual) al obtenido en cualquiera de las otras
posibles muestras, ya que depende de los datos que la componen.
Otros conceptos: distribución muestral:
El estadístico obtenido en cada una de las muestras se comporta como una variable aleatoria, y sus diferentes
valores forman una distribución de probabilidad que recibe el nombre de “distribución muestral”. El estadístico
obtenido en cada una de las muestras se comporta como una variable aleatoria, y sus diferentes valores forman
una distribución de probabilidad que recibe el nombre de “distribución muestral”.
- Distribución poblacional: distribución de datos individuales en la población.
- Distribución en la muestra: distribución de datos individuales en la muestra.
- Distribución muestral: distribución del estadístico obtenido en cada una de las distintas muestras.
PROBABILIDAD. DISTRIBUCIONES DE
PROBABILIDAD Y SUS APLICACIONES
Axiomas y propiedades de la probabilidad:
1. El valor de la probabilidad estará siempre comprendido en el intervalo [0,1], es decir, siempre será
superior o igual a 0 e inferior o igual a 1.
1. El suceso seguro tiene una probabilidad igual a la unidad, es decir, es aquel que ocurre en el 100% de las
ocasiones 1 y se cumplirá necesariamente.
1. Dos sucesos A y B son excluyentes o incompatibles, cuando no pueden acontecer simultáneamente. La
probabilidad de que ocurra alguno de ambos sucesos, p(A∪B) en lenguaje matemático o bien p (A o B) en
lenguaje convencional, es decir, que se cumpla bien un suceso o bien el otro, será igual a la suma de las
probabilidades de cada uno por separado. En esto consiste la propiedad aditiva de la probabilidad.
Axiomas y propiedades de la probabilidad:
4. La probabilidad del suceso complementario es igual a 1 menos la probabilidad del suceso inicial.
P(B)= 0,5
P(A)= 1- P(B)
4. La probabilidad del suceso imposible es 0.
4. Cuando los sucesos son compatibles:
- La probabilidad de su intersección es mayor de 0.
-La probabilidad de su unión es la suma de las probabilidades de ambos menos la probabilidad de la intersección:
Axiomas y propiedades de la probabilidad:
7. La probabilidad condicionada se puede definir como el cociente entre los casos favorables y los casos
posibles dentro de aquellos que cumplen una condición. Es la probabilidad de ocurrencia de un fenómeno
dentro de un subgrupo.
7. Las tablas pueden representarse como árboles de probabilidad:
Distribuciones de probabilidad:
En la práctica, nunca se tiene acceso directo al estudio de la población total y se utiliza solo una muestra que
procede de esa población teórica. En la muestra solo se pueden calcular estimadores.
Un estimador es una función de los valores de la muestra que permite obtener un valor aproximado de alguna
característica de la población de la que se ha extraído dicha muestra. El valor de esa característica en la población se
denomina parámetro.
Muestra (estimador): x
̄ , s, etc. Población (parámetro): μ, σ, etc.
Así, mientras que la media poblacional para una determinada característica de la población sería un parámetro
imposible de calcular en la práctica, un estimador proporciona una idea aproximada, que sería, en este caso, la media
muestral calculada en una muestra procedente de esa población.
Distribuciones de probabilidad:
Se denomina distribución de probabilidad a aquella que presenta el conjunto de todos los valores
que teóricamente podría tomar una variable, junto con sus correspondientes probabilidades.
Si se lanzase una moneda infinitas veces, se esperaría obtener un 50% de cruces. Pero esto es
teórico. Tras realizar en la práctica 20 lanzamientos, se obtienen, por ejemplo, 6 caras y 14 cruces en
vez de 10 caras y 10 cruces. Se debe a la variabilidad aleatoria o al azar, pues se trata solo de una
muestra. Lo encontrado en la muestra (6 caras y 14 cruces) sería la distribución empírica, mientras
que lo teóricamente esperado (50% de caras y 50% de cruces) sería la distribución de probabilidad.
Pero, si se lanzase la moneda más veces, la distribución empírica casi siempre se aproximará más a la
teórica.
Distribuciones de probabilidad:
● Distribución paramétrica y no-paramétrica:
Cuando el método usado requiere asumir que los datos de una muestra pertenecen a una población
con una distribución teórica conocida, suele decirse que dicho método es paramétrico. Se dice que es
un método paramétrico porque se basa en los parámetros que definen esa distribución teórica. Si no
se presupone nada acerca de la distribución de la población, se utilizan los métodos no paramétricos
o de distribución libre.
Distribuciones de probabilidad: distribución
uniforme discreta:
Se le llama uniforme a aquella distribución que otorga la misma probabilidad a la ocurrencia de todos los posibles
sucesos. Por ejemplo:
Imagínese que se lanza un dado 600 veces y se anotan las veces en que ha salido cada una de las seis caras. Existen
seis posibles resultados. Si el dado es correcto, cada uno de sus seis lados tiene teóricamente la misma probabilidad
de salir y lo esperado sería: 600/6 = 100. Si no existiese una cierta (aunque pequeña) variabilidad al azar, cada una de
las seis caras saldría 100 veces. A esta distribución de probabilidad se le llama «uniforme», porque otorga la misma
probabilidad a todos los sucesos.
Distribuciones de probabilidad: distribución
binomial:
La distribución binomial se refiere a sucesos en los que solo existen dos posibilidades (posibles resultados), como el
lanzamiento de una moneda. Se trata de dos sucesos mutuamente excluyentes.
Habrá siempre, por tanto, dos características («parámetros») que definen una distribución binomial:
1. El número (n) de intentos o de unidades.
2. La probabilidad (π) teórica de éxito en cada intento.
Se suele llamar n al número de intentos y π a la probabilidad de éxito en cada intento. Finalmente, falta fijar otra
característica, a la que se llamará k, que es el número de éxitos que se alcanzarán.
Existe la ecuación de la distribución binomial:
Distribuciones de probabilidad: distribución
normal/campana de Gauss:
El eje horizontal o de abscisas corresponde a cada uno de los valores posibles de la variable que se estudia (p. ej.,
niveles de colesterol), mientras que podría pensarse que el eje vertical (ordenadas) corresponde a la frecuencia con
que ocurre ese valor; sin embargo, la probabilidad de que suceda un valor individual aislado teóricamente es 0*, y
solo el área que queda bajo la curva correspondiente a un cierto intervalo de valores se interpreta como la
probabilidad de que ocurra alguno de los valores contenidos en ese intervalo.
*La probabilidad de un valor concreto es 0 porque el modelo matemático de la distribución normal es el de una
variable continua y, en esta situación, hablar de un valor concreto supondría una exactitud absoluta y radical.
Distribuciones de probabilidad: distribución
normal/campana de Gauss:
Por ejemplo, si se sabe que el nivel de colesterol total de una población sigue una distribución normal y se pregunta
cuál es la probabilidad de que alguien tenga un colesterol = 200 mg/dl, dicha probabilidad es 0, porque no se estará
refiriendo a que tenga un nivel de colesterol entre 199,5 y 200,5 mg/dl, ni entre 199,9 y 200,1 mg/dl, sino
exactamente 200,000000000000, y habría que ampliar los dígitos decimales hasta el infinito. La solución con la
distribución normal es valorar siempre la probabilidad para un rango o intervalo entre dos límites. En estos casos se
habla de densidad de probabilidad, un concepto que se refiere a la probabilidad de que un sujeto tenga un valor
incluido en un determinado intervalo entre dos valores. Aunque, como se verá más adelante, es importante desde el
punto de vista conceptual entender la densidad de probabilidad, su valor absoluto (valor de la altura del eje vertical)
tiene escasa utilidad práctica.
Distribuciones de probabilidad: distribución
normal/campana de Gauss:
La distribución normal teórica nunca se da exactamente en la realidad. Solo existen aproximaciones a ella, pero se puede expresar como
ecuación matemática. No es preciso conocer esta expresión matemática para resolver la mayor parte de los problemas relativos a la
distribución normal.
En general, una distribución normal se caracteriza por (fig. 3.14):
1. Tener forma de campana.
2. Ser simétrica (asimetría = 0).
3. No ser excesivamente plana ni excesivamente picuda (mesocúrtica).
4. Coincidir en ella la media, la mediana y la moda.
5. Tener aproximadamente el 95% de sus valores dentro del intervalo μ ± 2 σ (media ± 2 desviaciones estándar). Exactamente, el 95% de
los individuos se encuentra dentro del intervalo comprendido por μ ± 1,96 σ. Además, casi el 100% de los valores está dentro del
intervalo μ ± 3 σ. 6. Ser la distribución muestral que siguen los índices o estimadores estadísticos calculados en una muestra. Esto es lo
más importante.
Distribuciones de probabilidad: distribución
normal/campana de Gauss:
Desde el punto de vista práctico es importante adquirir familiaridad con el procedimiento de tipificar o estandarizar
la normal. Para obtener z se emplea la siguiente ecuación:
Por ejemplo, si la media de tensión arterial sistólica de una población es 120 mmHg y la desviación estándar es 25
mmHg, y se asume que sigue una distribución normal, se puede responder a diversas preguntas con estas sencillas
fórmulas. Así, para conocer la proporción de personas que tienen una tensión arterial sistólica superior a 170 mmHg
(fig. 3.15), habrá que calcular el valor z que corresponde a 170:
¿Qué significa saber que 170 mmHg corresponde a un valor de z = +2? En primer lugar, se sabrá que 170 mmHg está
dos desviaciones estándar por encima de la media.
Distribuciones de probabilidad: distribución
normal/campana de Gauss:
¿Qué significa saber que 170 mmHg corresponde a un valor de z = +2? En primer lugar, se sabrá que 170 mmHg está
dos desviaciones estándar por encima de la media. En segundo lugar, existen tablas de la distribución normal que
indican cuál es la probabilidad de que se dé un valor superior o inferior a cada valor de z.
A veces se denomina “a” a lo que queda fuera del área de interés (las colas) y, por tanto, el área central sería 1-a.
TEOREMA DEL LÍMITE CENTRAL
Teorema del límite central:
Aunque los valores que presenten los individuos de una población no sigan una distribución normal, la distribución
de los estimadores que se calculan en sucesivas muestras que se obtengan de estas poblaciones (distribución del
estimador muestral) sí que seguirá aproximadamente una distribución normal.
Esto figura en el núcleo de muchos métodos estadísticos y se conoce como teorema del límite central o teorema
central del límite. Hace posible que se puedan realizar inferencias estadísticas a partir de muestras usando las
propiedades de la distribución normal, aunque la población de la que procedan no siga la normal.
La única condición para que lo anterior se cumpla es que la muestra sea grande y extraída aleatoriamente de la
población. Cuanto más grande sea la muestra, mejor se cumple este teorema. Por encima de 60 individuos, la
adaptación de la distribución muestral de estimadores a la distribución normal es muy buena. Entre 30 y 60
individuos es aceptable. Por debajo de 30 individuos en la muestra empiezan a aparecer problemas (11).

Contenu connexe

Similaire à Investigación

Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
jennypao39
 
Estadistica descriptiva 2
Estadistica descriptiva 2 Estadistica descriptiva 2
Estadistica descriptiva 2
Paula Diaz
 
Esta Di Stica Descriptiva
Esta Di Stica DescriptivaEsta Di Stica Descriptiva
Esta Di Stica Descriptiva
lissa
 
10 análisis y parámetros estadísticos
10 análisis y parámetros estadísticos10 análisis y parámetros estadísticos
10 análisis y parámetros estadísticos
guestacef4d
 

Similaire à Investigación (20)

Estadistica y Probabilidad.
Estadistica y Probabilidad.Estadistica y Probabilidad.
Estadistica y Probabilidad.
 
Presentacion estadistica
Presentacion  estadisticaPresentacion  estadistica
Presentacion estadistica
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadistica descriptiva 2
Estadistica descriptiva 2 Estadistica descriptiva 2
Estadistica descriptiva 2
 
Esta Di Stica Descriptiva
Esta Di Stica DescriptivaEsta Di Stica Descriptiva
Esta Di Stica Descriptiva
 
Presentación de estadistica paola
Presentación de estadistica paolaPresentación de estadistica paola
Presentación de estadistica paola
 
Medidas de Dispersion
Medidas de DispersionMedidas de Dispersion
Medidas de Dispersion
 
Diapositivas 1
Diapositivas 1Diapositivas 1
Diapositivas 1
 
Medidas de centralización
Medidas de centralizaciónMedidas de centralización
Medidas de centralización
 
Terminos bassico estadistica
Terminos bassico estadisticaTerminos bassico estadistica
Terminos bassico estadistica
 
Terminos basicos en estadistica
Terminos basicos en estadisticaTerminos basicos en estadistica
Terminos basicos en estadistica
 
10 análisis y parámetros estadísticos
10 análisis y parámetros estadísticos10 análisis y parámetros estadísticos
10 análisis y parámetros estadísticos
 
Términos básicos de la estadística
Términos básicos de la estadísticaTérminos básicos de la estadística
Términos básicos de la estadística
 
Trabjo jose estadis
Trabjo jose estadisTrabjo jose estadis
Trabjo jose estadis
 
Trabajo jose estadistica
Trabajo jose estadisticaTrabajo jose estadistica
Trabajo jose estadistica
 
Variables y tipos de Variables
Variables y tipos de Variables Variables y tipos de Variables
Variables y tipos de Variables
 
Escalas de medicion maria velasquez
Escalas de medicion maria velasquezEscalas de medicion maria velasquez
Escalas de medicion maria velasquez
 
ESTADÍSTICA BÁSICA
ESTADÍSTICA BÁSICAESTADÍSTICA BÁSICA
ESTADÍSTICA BÁSICA
 
Presentacion medidas de dispersion
Presentacion medidas de dispersionPresentacion medidas de dispersion
Presentacion medidas de dispersion
 
Estadística básica de investigación ( medias, hipótesis ect)
Estadística básica de investigación ( medias, hipótesis ect)Estadística básica de investigación ( medias, hipótesis ect)
Estadística básica de investigación ( medias, hipótesis ect)
 

Dernier

ETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministroETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministro
IrisMoreno27
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
JC Díaz Herrera
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
MANUELVILELA7
 
Metodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdfMetodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdf
arteagaara
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 

Dernier (20)

Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
ETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministroETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministro
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Metodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdfMetodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 

Investigación

  • 3. Tipos de variables: ● Cualquier investigación suele exigir una fase de recogida de datos. A partir de ellos se calculan otros números, los índices estadísticos, que extraen la información importante contenida en los datos. ● A las cualidades o cantidades recogidas de cada individuo se les llama variables, porque pueden variar de un sujeto a otro, a diferencia de las constantes. ● Resulta básico distinguir los diferentes tipos de variables según las escalas que se usen para medirlas.
  • 4. Tipos de variables: variables cualitativas/categóricas nominales: Son variables en las que cada categoría o valor corresponde a una característica o cualidad que la persona posee. Los posibles valores son excluyentes (mujer-hombre, color de ojos, todas las variables cuyo valor pueda ser un sí o un no, etc.). Para su medición usamos escalas nominales, donde los valores se identifican con palabras. Una escala nominal sólo permite clasificar, pero no ordenar o jerarquizar. Únicamente se permiten operaciones de igualdad o desigualdad. Los posibles valores de una escala nominal podrían representarse con letras (A, B, C...). Puede decirse que la clase A es distinta de la B, pero no que sea mayor o menor. 1= mujer, 2= hombre (2 no es, en este caso, el doble de 1; son mutuamente excluyentes) *Si hay una posible gradación o jerarquización de los valores o categorías (unos son mayores que otros), entonces la escala no es nominal, sino ordinal.
  • 5. Tipos de variables: variables cualitativas/categóricas nominales: Las variables cualitativas o categóricas nominales pueden ser: ● Dicotómicas o binarias: si sólo admiten dos categorías. - Sano/enfermo, expuesto/no expuesto, hombre/mujer, etc. ● Policotómicas: con varias categorías. - Grupo sanguíneo (A/B/0/AB), cierto tipo de tratamiento (A/B/C), estado civil, etc.
  • 6. Tipos de variables: variables cualitativas ordinales: ● Son aquellas cuyos posibles valores se encuentran jerarquizados y ordenados. El tipo de escala utilizado se denomina ordinal. ● Con estas variables se pueden realizar no solo operaciones de igualdad y desigualdad, sino también operaciones de orden (jerarquizar los diferentes valores). ● Están en una situación intermedia (entre las cualitativas y las cuantitativas). Se trata, por ejemplo, del interés en dejar de fumar (interés). En este tipo de variables se puede decir que un grado 2 de interés es más intenso que un grado 1, pero nunca puede interpretarse como que tener un código 2 implique exactamente el doble de interés que el 1.
  • 7. Tipos de variables: variables cuantitativas: ● Hablamos de variables cuantitativas cuando los números utilizados para expresarlas equivalen realmente con exactitud a los verdaderos datos. Los datos son realmente numéricos. 1= mujer, 2=hombre Edad= 1, 2, 3, etc. Hay dos tipos: -Discretas: sus valores son finitos y coinciden con números enteros (Nº de hijos, Nº de intentos de dejar de fumar, etc.). - Continuas: permiten todas las operaciones hasta ahora comentadas y se miden en escala de razón*. Pueden adoptar valores con decimales (peso, edad, talla, etc.). *Los datos de escala de razón se definen como un tipo de datos cuantitativos que se caracterizan por un punto de cero absoluto, lo que significa que no hay ningún valor numérico negativo.
  • 8.
  • 10. Medidas de tendencia central: ● Media aritmética: Cuando se habla del «promedio» o de «la media» sin más especificaciones, siempre se trata de la media aritmética. Es la suma de todos los valores (xi ) dividida por el número de observaciones (n). La media de la población se expresa como μ y la media de una muestra, como x ̄ .
  • 11. Medidas de tendencia central: ● Media geométrica: La media geométrica suele usarse poco habitualmente, pero a veces resulta útil, por ejemplo, en microbiología, ya que las variables que se manejan suelen crecer exponencialmente. El símbolo que aparece dentro de la raíz (∏, una letra griega pi mayúscula) es el multiplicatorio y significa que hay que multiplicar uno por otro todos los valores de la variable. La raíz no es una raíz cuadrada, sino una raíz n-ésima, siendo n el tamaño de muestra. Una raíz cuadrada es la raíz 2, una raíz cúbica es la raíz 3. Eso es lo que significa la n en el superíndice junto al símbolo de raíz. La media geométrica de los valores 1, 2 y 3 sería la raíz cúbica del producto de 1 × 2 × 3.
  • 12. Medidas de tendencia central: ● Media armónica: También se utiliza poco, pero tiene aplicaciones en farmacología. Se dice que tanto la media geométrica como la media armónica son estimadores de tendencia central más robustos que la media aritmética: esto significa que se dejan influir menos por valores raros o extremos. Se calcula dividiendo el número de observaciones por la suma del inverso de cada valor.
  • 13. Medidas de tendencia central: ● Media ponderada: Se utiliza mucho. Por ejemplo: supongamos que un alumno ha obtenido las siguientes calificaciones en la asignatura «Bioestadística» de primero de medicina: Pruebas de clase: 8. Prácticas: 10. Examen final: 4. Si a las prácticas y a las pruebas de clase se les da un peso del 25%, y al examen final del 50%, ¿cuál será la media ponderada? Si llamamos wi a los pesos:
  • 14. Medidas de tendencia central: ● Mediana: Puede definirse como el valor central del conjunto ordenado de observaciones; es decir, el valor que deja la mitad de las observaciones por debajo y la mitad por encima. Cuando el número de datos es par, para hallar la mediana se calcula la media entre los dos datos centrales.
  • 15. Medidas de tendencia central: ● Mediana: La mediana es una medida de tendencia central que es robusta. Esto significa, por ejemplo, que si la mujer de mayor edad tuviese 100 años, la mediana seguiría siendo 49. En cambio, la media aritmética subiría de 43,8 a 50,7. Por tanto, la mediana es la medida de tendencia central que se usará cuando en muestras pequeñas haya alguna observación extrema («outlier») o cuando existan datos truncados o «censurados». Se dice que la mediana es robusta porque no se deja influir mucho por valores extremos. Sin embargo, tiene un inconveniente, y es que no se usan todos los valores observados para calcularla, sino solo el valor central o los dos valores centrales.
  • 16. Medidas de tendencia central: ● Moda: La moda tiene poco interés. Es el valor más frecuente.
  • 18. Medidas de dispersión: varianza: Para resumir unos datos no basta con decir cuál es su centro, sino que también hay que indicar en qué medida están juntos o separados de ese valor central. A esta característica se le llama dispersión. Cuanto más separados estén unos datos del valor central, más dispersos serán. La dispersión expresa el grado de variabilidad de unas observaciones. Por tanto, para resumir la información que hay en un conjunto de datos no basta con decir cuál es su media (u otra medida de tendencia central). Es preciso indicar también su variabilidad o dispersión. Por ejemplo:
  • 19. Medidas de dispersión: desviación típica/estándar: Para resumir la información que hay en un conjunto de datos no basta con decir cuál es su media (u otra medida de tendencia central). Es preciso indicar también su variabilidad o dispersión. Cuanto más separados estén los valores de la media, mayor será su dispersión. La desviación típica/estándar es una medida de dispersión.
  • 20. Medidas de dispersión: desviación típica/estándar: Para resumir la información que hay en un conjunto de datos no basta con decir cuál es su media (u otra medida de tendencia central). Es preciso indicar también su variabilidad o dispersión. Cuanto más separados estén los valores de la media, mayor será su dispersión. La desviación típica/estándar es una medida de dispersión.
  • 21. Medidas de dispersión: coeficiente de variación: Supongamos que la media de una variable vale 10 y su desviación estándar vale 5. Podríamos decir que la desviación estándar supone el 50% de la media (la mitad de los sujetos medios se encuentran entre los valores de la desviación estándar). A esta razón o cociente entre la desviación estándar y el valor de la media aritmética se le llama coeficiente de variación. Para poder conocer si los valores de una variable están dispersos o concentrados e incluso comparar la dispersión de diversas variables, se usa el coeficiente de variación. Por ejemplo: A= 3, 11, 22, 34, 47, 66, 73, 84, 101 B= 47, 48, 48, 49, 49, 49, 49, 51, 51 En el ejemplo A el coeficiente de variación es del 69,97%, mientras que en el ejemplo B es del 2,7%. De este modo, se aprecia claramente que la distribución de A es más dispersa que la de B.
  • 22. Medidas de dispersión: error estándar de la media: No se debe confundir error estándar con desviación estándar. La desviación estándar mide el grado de dispersión de los individuos que forman la muestra. En cambio, el error estándar de la media medirá el grado de dispersión de las medias de todas las posibles muestras de tamaño n que pudieran extraerse de la población. Por ejemplo: A= 3, 11, 22, 34, 47, 66, 73, 84, 101 B= 47, 48, 48, 49, 49, 49, 49, 51, 51 La desviación estándar del grupo A vale 34,1 y la del grupo B 1,3. Esta desviación estándar estima la distancia media a la que se encuentra cada uno de los 9 individuos estudiados respecto del valor medio de la edad del grupo (en ambos casos es 49). En cambio, el error estándar estima la desviación típica de un grupo imaginario formado por las medias de las posibles muestras de tamaño 9 que se pueden obtener de la población de la que procede la muestra. Por tanto, el error estándar es el error estándar de la media.
  • 24. Otros conceptos: estadístico/estimador muestral: Para cada característica evaluada, se obtendrán o más valores numéricos que se conocen como estadísticos o estimadores muestrales (medidas de tendencia central, de variabilidad, etc.). Será a partir de estos estadísticos obtenidos en la muestra (lo concreto) a través de los cuales tendremos que realizar afirmaciones sobre los valores de los parámetros de la población. En cada una de las muestras obtenidas de la población, se realizará la medición de las variables de interés y se obtendrá un estadístico. El valor del estadístico será diferente (o igual) al obtenido en cualquiera de las otras posibles muestras, ya que depende de los datos que la componen.
  • 25. Otros conceptos: distribución muestral: El estadístico obtenido en cada una de las muestras se comporta como una variable aleatoria, y sus diferentes valores forman una distribución de probabilidad que recibe el nombre de “distribución muestral”. El estadístico obtenido en cada una de las muestras se comporta como una variable aleatoria, y sus diferentes valores forman una distribución de probabilidad que recibe el nombre de “distribución muestral”. - Distribución poblacional: distribución de datos individuales en la población. - Distribución en la muestra: distribución de datos individuales en la muestra. - Distribución muestral: distribución del estadístico obtenido en cada una de las distintas muestras.
  • 27. Axiomas y propiedades de la probabilidad: 1. El valor de la probabilidad estará siempre comprendido en el intervalo [0,1], es decir, siempre será superior o igual a 0 e inferior o igual a 1. 1. El suceso seguro tiene una probabilidad igual a la unidad, es decir, es aquel que ocurre en el 100% de las ocasiones 1 y se cumplirá necesariamente. 1. Dos sucesos A y B son excluyentes o incompatibles, cuando no pueden acontecer simultáneamente. La probabilidad de que ocurra alguno de ambos sucesos, p(A∪B) en lenguaje matemático o bien p (A o B) en lenguaje convencional, es decir, que se cumpla bien un suceso o bien el otro, será igual a la suma de las probabilidades de cada uno por separado. En esto consiste la propiedad aditiva de la probabilidad.
  • 28. Axiomas y propiedades de la probabilidad: 4. La probabilidad del suceso complementario es igual a 1 menos la probabilidad del suceso inicial. P(B)= 0,5 P(A)= 1- P(B) 4. La probabilidad del suceso imposible es 0. 4. Cuando los sucesos son compatibles: - La probabilidad de su intersección es mayor de 0. -La probabilidad de su unión es la suma de las probabilidades de ambos menos la probabilidad de la intersección:
  • 29. Axiomas y propiedades de la probabilidad: 7. La probabilidad condicionada se puede definir como el cociente entre los casos favorables y los casos posibles dentro de aquellos que cumplen una condición. Es la probabilidad de ocurrencia de un fenómeno dentro de un subgrupo. 7. Las tablas pueden representarse como árboles de probabilidad:
  • 30. Distribuciones de probabilidad: En la práctica, nunca se tiene acceso directo al estudio de la población total y se utiliza solo una muestra que procede de esa población teórica. En la muestra solo se pueden calcular estimadores. Un estimador es una función de los valores de la muestra que permite obtener un valor aproximado de alguna característica de la población de la que se ha extraído dicha muestra. El valor de esa característica en la población se denomina parámetro. Muestra (estimador): x ̄ , s, etc. Población (parámetro): μ, σ, etc. Así, mientras que la media poblacional para una determinada característica de la población sería un parámetro imposible de calcular en la práctica, un estimador proporciona una idea aproximada, que sería, en este caso, la media muestral calculada en una muestra procedente de esa población.
  • 31. Distribuciones de probabilidad: Se denomina distribución de probabilidad a aquella que presenta el conjunto de todos los valores que teóricamente podría tomar una variable, junto con sus correspondientes probabilidades. Si se lanzase una moneda infinitas veces, se esperaría obtener un 50% de cruces. Pero esto es teórico. Tras realizar en la práctica 20 lanzamientos, se obtienen, por ejemplo, 6 caras y 14 cruces en vez de 10 caras y 10 cruces. Se debe a la variabilidad aleatoria o al azar, pues se trata solo de una muestra. Lo encontrado en la muestra (6 caras y 14 cruces) sería la distribución empírica, mientras que lo teóricamente esperado (50% de caras y 50% de cruces) sería la distribución de probabilidad. Pero, si se lanzase la moneda más veces, la distribución empírica casi siempre se aproximará más a la teórica.
  • 32. Distribuciones de probabilidad: ● Distribución paramétrica y no-paramétrica: Cuando el método usado requiere asumir que los datos de una muestra pertenecen a una población con una distribución teórica conocida, suele decirse que dicho método es paramétrico. Se dice que es un método paramétrico porque se basa en los parámetros que definen esa distribución teórica. Si no se presupone nada acerca de la distribución de la población, se utilizan los métodos no paramétricos o de distribución libre.
  • 33. Distribuciones de probabilidad: distribución uniforme discreta: Se le llama uniforme a aquella distribución que otorga la misma probabilidad a la ocurrencia de todos los posibles sucesos. Por ejemplo: Imagínese que se lanza un dado 600 veces y se anotan las veces en que ha salido cada una de las seis caras. Existen seis posibles resultados. Si el dado es correcto, cada uno de sus seis lados tiene teóricamente la misma probabilidad de salir y lo esperado sería: 600/6 = 100. Si no existiese una cierta (aunque pequeña) variabilidad al azar, cada una de las seis caras saldría 100 veces. A esta distribución de probabilidad se le llama «uniforme», porque otorga la misma probabilidad a todos los sucesos.
  • 34. Distribuciones de probabilidad: distribución binomial: La distribución binomial se refiere a sucesos en los que solo existen dos posibilidades (posibles resultados), como el lanzamiento de una moneda. Se trata de dos sucesos mutuamente excluyentes. Habrá siempre, por tanto, dos características («parámetros») que definen una distribución binomial: 1. El número (n) de intentos o de unidades. 2. La probabilidad (π) teórica de éxito en cada intento. Se suele llamar n al número de intentos y π a la probabilidad de éxito en cada intento. Finalmente, falta fijar otra característica, a la que se llamará k, que es el número de éxitos que se alcanzarán. Existe la ecuación de la distribución binomial:
  • 35. Distribuciones de probabilidad: distribución normal/campana de Gauss: El eje horizontal o de abscisas corresponde a cada uno de los valores posibles de la variable que se estudia (p. ej., niveles de colesterol), mientras que podría pensarse que el eje vertical (ordenadas) corresponde a la frecuencia con que ocurre ese valor; sin embargo, la probabilidad de que suceda un valor individual aislado teóricamente es 0*, y solo el área que queda bajo la curva correspondiente a un cierto intervalo de valores se interpreta como la probabilidad de que ocurra alguno de los valores contenidos en ese intervalo. *La probabilidad de un valor concreto es 0 porque el modelo matemático de la distribución normal es el de una variable continua y, en esta situación, hablar de un valor concreto supondría una exactitud absoluta y radical.
  • 36. Distribuciones de probabilidad: distribución normal/campana de Gauss: Por ejemplo, si se sabe que el nivel de colesterol total de una población sigue una distribución normal y se pregunta cuál es la probabilidad de que alguien tenga un colesterol = 200 mg/dl, dicha probabilidad es 0, porque no se estará refiriendo a que tenga un nivel de colesterol entre 199,5 y 200,5 mg/dl, ni entre 199,9 y 200,1 mg/dl, sino exactamente 200,000000000000, y habría que ampliar los dígitos decimales hasta el infinito. La solución con la distribución normal es valorar siempre la probabilidad para un rango o intervalo entre dos límites. En estos casos se habla de densidad de probabilidad, un concepto que se refiere a la probabilidad de que un sujeto tenga un valor incluido en un determinado intervalo entre dos valores. Aunque, como se verá más adelante, es importante desde el punto de vista conceptual entender la densidad de probabilidad, su valor absoluto (valor de la altura del eje vertical) tiene escasa utilidad práctica.
  • 37. Distribuciones de probabilidad: distribución normal/campana de Gauss: La distribución normal teórica nunca se da exactamente en la realidad. Solo existen aproximaciones a ella, pero se puede expresar como ecuación matemática. No es preciso conocer esta expresión matemática para resolver la mayor parte de los problemas relativos a la distribución normal. En general, una distribución normal se caracteriza por (fig. 3.14): 1. Tener forma de campana. 2. Ser simétrica (asimetría = 0). 3. No ser excesivamente plana ni excesivamente picuda (mesocúrtica). 4. Coincidir en ella la media, la mediana y la moda. 5. Tener aproximadamente el 95% de sus valores dentro del intervalo μ ± 2 σ (media ± 2 desviaciones estándar). Exactamente, el 95% de los individuos se encuentra dentro del intervalo comprendido por μ ± 1,96 σ. Además, casi el 100% de los valores está dentro del intervalo μ ± 3 σ. 6. Ser la distribución muestral que siguen los índices o estimadores estadísticos calculados en una muestra. Esto es lo más importante.
  • 38. Distribuciones de probabilidad: distribución normal/campana de Gauss: Desde el punto de vista práctico es importante adquirir familiaridad con el procedimiento de tipificar o estandarizar la normal. Para obtener z se emplea la siguiente ecuación: Por ejemplo, si la media de tensión arterial sistólica de una población es 120 mmHg y la desviación estándar es 25 mmHg, y se asume que sigue una distribución normal, se puede responder a diversas preguntas con estas sencillas fórmulas. Así, para conocer la proporción de personas que tienen una tensión arterial sistólica superior a 170 mmHg (fig. 3.15), habrá que calcular el valor z que corresponde a 170: ¿Qué significa saber que 170 mmHg corresponde a un valor de z = +2? En primer lugar, se sabrá que 170 mmHg está dos desviaciones estándar por encima de la media.
  • 39. Distribuciones de probabilidad: distribución normal/campana de Gauss: ¿Qué significa saber que 170 mmHg corresponde a un valor de z = +2? En primer lugar, se sabrá que 170 mmHg está dos desviaciones estándar por encima de la media. En segundo lugar, existen tablas de la distribución normal que indican cuál es la probabilidad de que se dé un valor superior o inferior a cada valor de z. A veces se denomina “a” a lo que queda fuera del área de interés (las colas) y, por tanto, el área central sería 1-a.
  • 41. Teorema del límite central: Aunque los valores que presenten los individuos de una población no sigan una distribución normal, la distribución de los estimadores que se calculan en sucesivas muestras que se obtengan de estas poblaciones (distribución del estimador muestral) sí que seguirá aproximadamente una distribución normal. Esto figura en el núcleo de muchos métodos estadísticos y se conoce como teorema del límite central o teorema central del límite. Hace posible que se puedan realizar inferencias estadísticas a partir de muestras usando las propiedades de la distribución normal, aunque la población de la que procedan no siga la normal. La única condición para que lo anterior se cumpla es que la muestra sea grande y extraída aleatoriamente de la población. Cuanto más grande sea la muestra, mejor se cumple este teorema. Por encima de 60 individuos, la adaptación de la distribución muestral de estimadores a la distribución normal es muy buena. Entre 30 y 60 individuos es aceptable. Por debajo de 30 individuos en la muestra empiezan a aparecer problemas (11).