SlideShare une entreprise Scribd logo
1  sur  19
Bioestadística
Tema 1: Introducción a la
estadística
Bioestadística. U. Málaga.

Tema 1: Introdución

1
¿Para qué sirve la estadística?


La Ciencia se ocupa en general de fenómenos observables



La Ciencia se desarrolla observando hechos, formulando leyes que los
explican y realizando experimentos para validar o rechazar dichas leyes



Los modelos que crea la ciencia son de tipo determinista o aleatorio
(estocástico)



La Estadística se utiliza como tecnología al servicio de las ciencias
donde la variabilidad y la incertidumbre forman parte de su naturaleza



“La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de
las Ciencias de la Vida donde la variablidad no es la excepción sino la
regla”
Carrasco de la Peña (1982)

Tema
Bioestadística. U. Málaga. 1: Introdución

2
Definición
La Estadística es la Ciencia de la
Sistematización, recogida, ordenación y
a
t i v presentación de los datos referentes a un fenómeno
rip
que presenta variabilidad o incertidumbre para su
sc
De
estudio metódico, con objeto de
•

•
ro
P

In

b

i
ab

li

deducir las leyes que rigen esos fenómenos,

d
da

y poder de esa forma hacer previsiones sobre los
a
c i mismos, tomar decisiones u obtener conclusiones.
n
•

r
fe

e

Tema
Bioestadística. U. Málaga. 1: Introdución

3
Pasos en un estudio estadístico


Plantear hipótesis sobre una población





Decidir qué datos recoger (diseño de experimentos)


Qué individuos pertenecerán al estudio (muestras)








¿Estratificado? ¿Sistemáticamente?



tiempo medio de baja en fumadores y no (estadísticos)
% de bajas por fumadores y sexo (frecuencias), gráficos,...

Realizar una inferencia sobre la población




No tenéis que
entenderlo (aún)

Describir (resumir) los datos obtenidos




Número de bajas
Tiempo de duración de cada baja
¿Sexo? ¿Sector laboral? ¿Otros factores?

Recoger los datos (muestreo)




Fumadores y no fumadores en edad laboral.
Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades
crónicas?

Qué datos recoger de los mismos (variables)




Los fumadores tienen “más bajas” laborales que los no fumadores
¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.

Cuantificar la confianza en la inferencia



Nivel de confianza del 95%
Significación del contraste: p=2%

Tema
Bioestadística. U. Málaga. 1: Introdución

4
Método científico y estadística
Plantear
hipótesis

Diseñar
experimento

Obtener
conclusiones

Recoger datos
y analizarlos

Tema
Bioestadística. U. Málaga. 1: Introdución

5
Población y muestra


Población (‘population’) es el conjunto sobre el que estamos
interesados en obtener conclusiones (hacer inferencia).
 Normalmente es demasiado grande para poder abarcarlo.



Muestra (‘sample’) es un subconjunto suyo al que tenemos
acceso y sobre el que realmente hacemos las observaciones
(mediciones)
 Debería ser “representativo”
 Esta formado por miembros “seleccionados” de la población
(individuos, unidades experimentales).

Tema
Bioestadística. U. Málaga. 1: Introdución

6
Variables




Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que disponemos
de cada individuo es resumida en variables.

En los individuos de la población española, de uno
a otro es variable:


El grupo sanguíneo




Su nivel de felicidad “declarado”




{Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal

El número de hijos




{A, B, AB, O}  Var. Cualitativa

{0,1,2,3,...}  Var. Numérica discreta

La altura


{1’62 ; 1’74; ...}  Var. Numérica continua

Tema
Bioestadística. U. Málaga. 1: Introdución

7
Tipos de variables


Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
número (no se pueden hacer operaciones algebraicas con ellos)


Nominales: Si sus valores no se pueden ordenar




Ordinales: Si sus valores se pueden ordenar




Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)


Discretas: Si toma valores enteros




Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


Altura, Presión intraocular, Dosis de medicamento administrado, edad

Tema
Bioestadística. U. Málaga. 1: Introdución

8




Es buena idea codificar las variables
como números para poder procesarlas
con facilidad en un ordenador.
Es conveniente asignar “etiquetas” a
los valores de las variables para
recordar qué significan los códigos
numéricos.


Sexo (Cualit: Códigos arbitrarios)





Raza (Cualit: Códigos arbitrarios)








1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz

Se pueden asignar códigos a
respuestas especiales como





1 = Blanca
2 = Negra,...

Felicidad Ordinal: Respetar un orden al
codificar.




1 = Hombre
2 = Mujer

0 = No sabe
99 = No contesta...

Estas situaciones deberán ser tenidas
en cuentas en el análisis. Datos
perdidos (‘missing data’)

Tema
Bioestadística. U. Málaga. 1: Introdución

9




Aunque se codifiquen como números, debemos recordar siempre el
verdadero tipo de las variables y su significado cuando vayamos a
usar programas de cálculo estadístico.
No todo está permitido con cualquier tipo de variable.

Tema
Bioestadística. U. Málaga. 1: Introdución

10


Los posibles valores de una variable suelen denominarse modalidades.



Las modalidades pueden agruparse en clases (intervalos)
 Edades:




Hijos:




Menos de 20 años, de 20 a 50 años, más de 50 años
Menos de 3 hijos, De 3 a 5, 6 o más hijos

Las modalidades/clases deben forman un sistema exhaustivo y
excluyente
 Exhaustivo: No podemos olvidar ningún posible valor de la variable





Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
Bien: ¿Cuál es su grupo sanguíneo?

Excluyente: Nadie puede presentar dos valores
simultáneos de la variable


Estudio sobre el ocio





Mal: De los siguientes, qué le gusta: (deporte, cine)
Bien: Le gusta el deporte: (Sí, No)
Bien: Le gusta el cine: (Sí, No)
Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)

Tema
Bioestadística. U. Málaga. 1: Introdución

11
Presentación ordenada de datos
7

Género

Frec.

Hombre

4

6
5
4
3

Mujer

6

2
1
0
Hombre



Mujer

Las tablas de frecuencias y las representaciones
gráficas son dos maneras equivalentes de presentar la
información. Las dos exponen ordenadamente la
información recogida en una muestra.

Tema
Bioestadística. U. Málaga. 1: Introdución

12
Tablas de frecuencia


Exponen la información recogida en la muestra, de forma que no se pierda nada de
información (o poca).


Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad



Frecuencias relativas (porcentajes): Idem, pero dividido por el total



Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas


Muy útiles para calcular cuantiles (ver más adelante)



¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5%

Sexo del encuestado

Válidos

Hombre
Mujer
Total

Frecuencia
636
881
1517

Porcentaje
41,9
58,1
100,0

Número de hijos
Porcentaje
válido
41,9
58,1
100,0

Válidos

Nivel de felicidad

Válidos

Perdidos
Total

Muy feliz
Bastante feliz
No demasiado feliz
Total
No contesta

Frecuencia
467
872
165
1504
13
1517

Porcentaje
30,8
57,5
10,9
99,1
,9
100,0

Porcentaje
válido
31,1
58,0
11,0
100,0

Porcentaje
acumulado
31,1
89,0
100,0

Tema
Bioestadística. U. Málaga. 1: Introdución

Perdidos
Total

0
1
2
3
4
5
6
7
Ocho o más
Total
No contesta

Frecuencia
419
255
375
215
127
54
24
23
17
1509
8
1517

Porcentaje
27,6
16,8
24,7
14,2
8,4
3,6
1,6
1,5
1,1
99,5
,5
100,0

Porcentaje
válido
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcentaje
acumulado
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

13
Datos desordenados y ordenados en tablas


Variable: Género


Modalidades:



H = Hombre
M = Mujer

Género Frec.

Frec. relat.
porcentaje

Hombre 4

4/10=0,4=40%

Mujer

6/10=0,6=60%

6
10=tamaño
muestral



Muestra:
MHHMMHMMMH


equivale a
HHHH MMMMMM

Tema
Bioestadística. U. Málaga. 1: Introdución

14
Ejemplo


¿Cuántos individuos tienen
menos de 2 hijos?
 frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos



¿Qué porcentaje de individuos
tiene 6 hijos o menos?
 97,3%



¿Qué cantidad de hijos es tal
que al menos el 50% de la
población tiene una cantidad
inferior o igual?
 2 hijos

Tema
Bioestadística. U. Málaga. 1: Introdución

Número de hijos

0
1
2
3
4
5
6
7
Ocho+
Total

Frec.
419
255
375
215
127
54
24
23
17
1509

Porcent.
(válido)
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcent.
acum.
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

15

≥50%
Gráficos para v. cualitativas


Diagramas de barras





Diagramas de sectores (tartas, polares)





Alturas proporcionales a las frecuencias (abs. o
rel.)
Se pueden aplicar también a variables discretas

No usarlo con variables ordinales.
El área de cada sector es proporcional a su
frecuencia (abs. o rel.)

Pictogramas



Fáciles de entender.
El área de cada modalidad debe ser proporcional a
la frecuencia. ¿De los dos, cuál es incorrecto?.

Tema
Bioestadística. U. Málaga. 1: Introdución

16
Gráficos diferenciales para variables numéricas
419
400

Son diferentes en función de que las
variables sean discretas o continuas.
Valen con frec. absolutas o relativas.


300

Recuento



255
215
200

127
100

54
24

Diagramas barras para v. discretas


375

0

Se deja un hueco entre barras para indicar
los valores que no son posibles

1

2

3

4

5

6

23

17

7 Ocho o más

Número de hijos

250

Histogramas para v. continuas


El área que hay bajo el histograma entre
dos puntos cualesquiera indica la cantidad
(porcentaje o frecuencia) de individuos en
el intervalo.

200

Recuento



150

100

50

20

40

60

80

Edad del encuestado

Tema
Bioestadística. U. Málaga. 1: Introdución

17
Diagramas integrales


Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan
a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad
(frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos
en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por
derivación (en un sentido más general del que visteis en bachillerato.)

Tema
Bioestadística. U. Málaga. 1: Introdución

18
¿Qué hemos visto?





Definición de estadística
Población
Muestra
Variables





Cualitativas
Numéricas

Presentación ordenada de datos


Tablas de frecuencias






absolutas
relativas
acumuladas

Representaciones gráficas



Cualitativas
Numéricas



Diferenciales
Integrales

Tema
Bioestadística. U. Málaga. 1: Introdución

19

Contenu connexe

Tendances

Conceptos basicos
Conceptos basicosConceptos basicos
Conceptos basicos
javier
 
Muestreo aleat. simple
Muestreo aleat. simpleMuestreo aleat. simple
Muestreo aleat. simple
kjota11
 
Clase población muestra y muestreo
Clase población muestra y muestreoClase población muestra y muestreo
Clase población muestra y muestreo
MadelynSaidy
 
Clase1 estadística preceptores
Clase1 estadística preceptoresClase1 estadística preceptores
Clase1 estadística preceptores
Alejandra Camors
 

Tendances (20)

Calculo de la muestra
Calculo de la muestraCalculo de la muestra
Calculo de la muestra
 
Estadística simple
Estadística simpleEstadística simple
Estadística simple
 
Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generales
 
Estadística Elemental.
Estadística Elemental.Estadística Elemental.
Estadística Elemental.
 
Conceptos basicos
Conceptos basicosConceptos basicos
Conceptos basicos
 
Muestreo aleatorio simple estadistica
Muestreo aleatorio simple estadisticaMuestreo aleatorio simple estadistica
Muestreo aleatorio simple estadistica
 
Estadistica grado 11
Estadistica grado 11Estadistica grado 11
Estadistica grado 11
 
Taller 1 estadistica
Taller   1 estadisticaTaller   1 estadistica
Taller 1 estadistica
 
Muestreo aleat. simple
Muestreo aleat. simpleMuestreo aleat. simple
Muestreo aleat. simple
 
Psico 6ta medidas posición relativa
Psico 6ta  medidas posición relativaPsico 6ta  medidas posición relativa
Psico 6ta medidas posición relativa
 
Estadística en la aplicación de recursos humanos
Estadística en la aplicación de recursos humanosEstadística en la aplicación de recursos humanos
Estadística en la aplicación de recursos humanos
 
Estadistica ii
Estadistica iiEstadistica ii
Estadistica ii
 
ESTADISTICA
ESTADISTICAESTADISTICA
ESTADISTICA
 
Estadística: semana01
Estadística: semana01Estadística: semana01
Estadística: semana01
 
Muestreo aleatorio simple
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo aleatorio simple
 
Clase población muestra y muestreo
Clase población muestra y muestreoClase población muestra y muestreo
Clase población muestra y muestreo
 
Clase1 estadística preceptores
Clase1 estadística preceptoresClase1 estadística preceptores
Clase1 estadística preceptores
 
8 muestreo aleatorio
8 muestreo aleatorio8 muestreo aleatorio
8 muestreo aleatorio
 
Estadística Muestreo
Estadística MuestreoEstadística Muestreo
Estadística Muestreo
 
Prueba De HipóTesis Sobre La Diferencia De Proporciones Poblacionales
Prueba De HipóTesis Sobre La Diferencia De Proporciones PoblacionalesPrueba De HipóTesis Sobre La Diferencia De Proporciones Poblacionales
Prueba De HipóTesis Sobre La Diferencia De Proporciones Poblacionales
 

En vedette

TamañO De La Muestra
TamañO De La MuestraTamañO De La Muestra
TamañO De La Muestra
Ana kristell
 
Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...
Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...
Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...
corpoaguacate
 
Biol 2153-1-investigaciones [compatibility mode]
Biol 2153-1-investigaciones [compatibility mode]Biol 2153-1-investigaciones [compatibility mode]
Biol 2153-1-investigaciones [compatibility mode]
Vessel Dueff
 
Bioestadistica clase7-8
Bioestadistica clase7-8Bioestadistica clase7-8
Bioestadistica clase7-8
CUR
 

En vedette (20)

TamañO De La Muestra
TamañO De La MuestraTamañO De La Muestra
TamañO De La Muestra
 
Nociones de estadística
Nociones de estadística Nociones de estadística
Nociones de estadística
 
Nociones básicas de estadística
Nociones básicas de estadísticaNociones básicas de estadística
Nociones básicas de estadística
 
Tipos de escalas y variables estadísticas
Tipos de escalas y variables estadísticasTipos de escalas y variables estadísticas
Tipos de escalas y variables estadísticas
 
Descripción cuantitativa de enfermedades de las plantas
Descripción cuantitativa de enfermedades de las plantasDescripción cuantitativa de enfermedades de las plantas
Descripción cuantitativa de enfermedades de las plantas
 
epidemilogia
epidemilogiaepidemilogia
epidemilogia
 
Terminos Tics
Terminos TicsTerminos Tics
Terminos Tics
 
01 Presentacion
01   Presentacion01   Presentacion
01 Presentacion
 
Distribucioncontinua
DistribucioncontinuaDistribucioncontinua
Distribucioncontinua
 
Bioestadistica clase6
Bioestadistica clase6Bioestadistica clase6
Bioestadistica clase6
 
Clase repaso bioestadistica URV 2011
Clase repaso bioestadistica URV 2011Clase repaso bioestadistica URV 2011
Clase repaso bioestadistica URV 2011
 
Bioestadistica jueves 15 de marzo 2012
Bioestadistica   jueves 15 de marzo 2012Bioestadistica   jueves 15 de marzo 2012
Bioestadistica jueves 15 de marzo 2012
 
Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...
Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...
Incidencia, diagnóstico, comportamiento y alternativas de manejo de la marchi...
 
Muestreo. Lic Henry Andrade
Muestreo. Lic Henry AndradeMuestreo. Lic Henry Andrade
Muestreo. Lic Henry Andrade
 
Media, varianza y desviación estandar
Media, varianza y desviación estandarMedia, varianza y desviación estandar
Media, varianza y desviación estandar
 
Biol 2153-1-investigaciones [compatibility mode]
Biol 2153-1-investigaciones [compatibility mode]Biol 2153-1-investigaciones [compatibility mode]
Biol 2153-1-investigaciones [compatibility mode]
 
bioestadistica
 bioestadistica bioestadistica
bioestadistica
 
Bioestadistica clase7-8
Bioestadistica clase7-8Bioestadistica clase7-8
Bioestadistica clase7-8
 
1.2. gráficas
1.2.  gráficas1.2.  gráficas
1.2. gráficas
 
Informatica (28/3/12)
Informatica (28/3/12)Informatica (28/3/12)
Informatica (28/3/12)
 

Similaire à Estad uma 01

estadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticosestadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticos
nicolassoto71
 
estadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzadaestadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzada
GerardoCordova18
 
Estad uma 01
Estad uma 01Estad uma 01
Estad uma 01
cuevanet
 
Apuntes de biesadistica 1
Apuntes de biesadistica 1Apuntes de biesadistica 1
Apuntes de biesadistica 1
29100937
 

Similaire à Estad uma 01 (20)

estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticosestadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticos
 
estadistica datos agrupados e introduccion
estadistica datos agrupados e introduccionestadistica datos agrupados e introduccion
estadistica datos agrupados e introduccion
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzadaestadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzada
 
INTRODUCCION A LA ESTADÍSTICA.pdf
INTRODUCCION A LA ESTADÍSTICA.pdfINTRODUCCION A LA ESTADÍSTICA.pdf
INTRODUCCION A LA ESTADÍSTICA.pdf
 
Estad uma 01
Estad uma 01Estad uma 01
Estad uma 01
 
SEMANA 01.pdf
SEMANA 01.pdfSEMANA 01.pdf
SEMANA 01.pdf
 
Introducción a la Estadísitica Descriptiva
Introducción a la Estadísitica DescriptivaIntroducción a la Estadísitica Descriptiva
Introducción a la Estadísitica Descriptiva
 
Estadistica 1 para egb
Estadistica 1 para egbEstadistica 1 para egb
Estadistica 1 para egb
 
diapositivas de estadistica.ppt
diapositivas de estadistica.pptdiapositivas de estadistica.ppt
diapositivas de estadistica.ppt
 
Clase 1 29 de marzo.ppt
Clase 1 29 de marzo.pptClase 1 29 de marzo.ppt
Clase 1 29 de marzo.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
3esoestad uma 01
3esoestad uma 013esoestad uma 01
3esoestad uma 01
 
Apuntes de biesadistica 1
Apuntes de biesadistica 1Apuntes de biesadistica 1
Apuntes de biesadistica 1
 
Bioestadísticas
BioestadísticasBioestadísticas
Bioestadísticas
 
1._Metod_Estad.ppt
1._Metod_Estad.ppt1._Metod_Estad.ppt
1._Metod_Estad.ppt
 

Estad uma 01

  • 1. Bioestadística Tema 1: Introducción a la estadística Bioestadística. U. Málaga. Tema 1: Introdución 1
  • 2. ¿Para qué sirve la estadística?  La Ciencia se ocupa en general de fenómenos observables  La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes  Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)  La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza  “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de las Ciencias de la Vida donde la variablidad no es la excepción sino la regla” Carrasco de la Peña (1982) Tema Bioestadística. U. Málaga. 1: Introdución 2
  • 3. Definición La Estadística es la Ciencia de la Sistematización, recogida, ordenación y a t i v presentación de los datos referentes a un fenómeno rip que presenta variabilidad o incertidumbre para su sc De estudio metódico, con objeto de • • ro P In b i ab li deducir las leyes que rigen esos fenómenos, d da y poder de esa forma hacer previsiones sobre los a c i mismos, tomar decisiones u obtener conclusiones. n • r fe e Tema Bioestadística. U. Málaga. 1: Introdución 3
  • 4. Pasos en un estudio estadístico  Plantear hipótesis sobre una población    Decidir qué datos recoger (diseño de experimentos)  Qué individuos pertenecerán al estudio (muestras)      ¿Estratificado? ¿Sistemáticamente?  tiempo medio de baja en fumadores y no (estadísticos) % de bajas por fumadores y sexo (frecuencias), gráficos,... Realizar una inferencia sobre la población   No tenéis que entenderlo (aún) Describir (resumir) los datos obtenidos   Número de bajas Tiempo de duración de cada baja ¿Sexo? ¿Sector laboral? ¿Otros factores? Recoger los datos (muestreo)   Fumadores y no fumadores en edad laboral. Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? Qué datos recoger de los mismos (variables)   Los fumadores tienen “más bajas” laborales que los no fumadores ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? Los fumadores están de baja al menos 10 días/año más de media que los no fumadores. Cuantificar la confianza en la inferencia   Nivel de confianza del 95% Significación del contraste: p=2% Tema Bioestadística. U. Málaga. 1: Introdución 4
  • 5. Método científico y estadística Plantear hipótesis Diseñar experimento Obtener conclusiones Recoger datos y analizarlos Tema Bioestadística. U. Málaga. 1: Introdución 5
  • 6. Población y muestra  Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).  Normalmente es demasiado grande para poder abarcarlo.  Muestra (‘sample’) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)  Debería ser “representativo”  Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales). Tema Bioestadística. U. Málaga. 1: Introdución 6
  • 7. Variables   Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. En los individuos de la población española, de uno a otro es variable:  El grupo sanguíneo   Su nivel de felicidad “declarado”   {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal El número de hijos   {A, B, AB, O}  Var. Cualitativa {0,1,2,3,...}  Var. Numérica discreta La altura  {1’62 ; 1’74; ...}  Var. Numérica continua Tema Bioestadística. U. Málaga. 1: Introdución 7
  • 8. Tipos de variables  Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos)  Nominales: Si sus valores no se pueden ordenar   Ordinales: Si sus valores se pueden ordenar   Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No) Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor Cuantitativas o Numéricas Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)  Discretas: Si toma valores enteros   Número de hijos, Número de cigarrillos, Num. de “cumpleaños” Continuas: Si entre dos valores, son posibles infinitos valores intermedios.  Altura, Presión intraocular, Dosis de medicamento administrado, edad Tema Bioestadística. U. Málaga. 1: Introdución 8
  • 9.   Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos.  Sexo (Cualit: Códigos arbitrarios)    Raza (Cualit: Códigos arbitrarios)      1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz Se pueden asignar códigos a respuestas especiales como    1 = Blanca 2 = Negra,... Felicidad Ordinal: Respetar un orden al codificar.   1 = Hombre 2 = Mujer 0 = No sabe 99 = No contesta... Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’) Tema Bioestadística. U. Málaga. 1: Introdución 9
  • 10.   Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico. No todo está permitido con cualquier tipo de variable. Tema Bioestadística. U. Málaga. 1: Introdución 10
  • 11.  Los posibles valores de una variable suelen denominarse modalidades.  Las modalidades pueden agruparse en clases (intervalos)  Edades:   Hijos:   Menos de 20 años, de 20 a 50 años, más de 50 años Menos de 3 hijos, De 3 a 5, 6 o más hijos Las modalidades/clases deben forman un sistema exhaustivo y excluyente  Exhaustivo: No podemos olvidar ningún posible valor de la variable    Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)? Bien: ¿Cuál es su grupo sanguíneo? Excluyente: Nadie puede presentar dos valores simultáneos de la variable  Estudio sobre el ocio     Mal: De los siguientes, qué le gusta: (deporte, cine) Bien: Le gusta el deporte: (Sí, No) Bien: Le gusta el cine: (Sí, No) Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2) Tema Bioestadística. U. Málaga. 1: Introdución 11
  • 12. Presentación ordenada de datos 7 Género Frec. Hombre 4 6 5 4 3 Mujer 6 2 1 0 Hombre  Mujer Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra. Tema Bioestadística. U. Málaga. 1: Introdución 12
  • 13. Tablas de frecuencia  Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca).  Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad  Frecuencias relativas (porcentajes): Idem, pero dividido por el total  Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas  Muy útiles para calcular cuantiles (ver más adelante)   ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8 ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5% Sexo del encuestado Válidos Hombre Mujer Total Frecuencia 636 881 1517 Porcentaje 41,9 58,1 100,0 Número de hijos Porcentaje válido 41,9 58,1 100,0 Válidos Nivel de felicidad Válidos Perdidos Total Muy feliz Bastante feliz No demasiado feliz Total No contesta Frecuencia 467 872 165 1504 13 1517 Porcentaje 30,8 57,5 10,9 99,1 ,9 100,0 Porcentaje válido 31,1 58,0 11,0 100,0 Porcentaje acumulado 31,1 89,0 100,0 Tema Bioestadística. U. Málaga. 1: Introdución Perdidos Total 0 1 2 3 4 5 6 7 Ocho o más Total No contesta Frecuencia 419 255 375 215 127 54 24 23 17 1509 8 1517 Porcentaje 27,6 16,8 24,7 14,2 8,4 3,6 1,6 1,5 1,1 99,5 ,5 100,0 Porcentaje válido 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcentaje acumulado 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0 13
  • 14. Datos desordenados y ordenados en tablas  Variable: Género  Modalidades:   H = Hombre M = Mujer Género Frec. Frec. relat. porcentaje Hombre 4 4/10=0,4=40% Mujer 6/10=0,6=60% 6 10=tamaño muestral  Muestra: MHHMMHMMMH  equivale a HHHH MMMMMM Tema Bioestadística. U. Málaga. 1: Introdución 14
  • 15. Ejemplo  ¿Cuántos individuos tienen menos de 2 hijos?  frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos  ¿Qué porcentaje de individuos tiene 6 hijos o menos?  97,3%  ¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual?  2 hijos Tema Bioestadística. U. Málaga. 1: Introdución Número de hijos 0 1 2 3 4 5 6 7 Ocho+ Total Frec. 419 255 375 215 127 54 24 23 17 1509 Porcent. (válido) 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcent. acum. 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0 15 ≥50%
  • 16. Gráficos para v. cualitativas  Diagramas de barras    Diagramas de sectores (tartas, polares)    Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar también a variables discretas No usarlo con variables ordinales. El área de cada sector es proporcional a su frecuencia (abs. o rel.) Pictogramas   Fáciles de entender. El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?. Tema Bioestadística. U. Málaga. 1: Introdución 16
  • 17. Gráficos diferenciales para variables numéricas 419 400 Son diferentes en función de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.  300 Recuento  255 215 200 127 100 54 24 Diagramas barras para v. discretas  375 0 Se deja un hueco entre barras para indicar los valores que no son posibles 1 2 3 4 5 6 23 17 7 Ocho o más Número de hijos 250 Histogramas para v. continuas  El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo. 200 Recuento  150 100 50 20 40 60 80 Edad del encuestado Tema Bioestadística. U. Málaga. 1: Introdución 17
  • 18. Diagramas integrales  Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por derivación (en un sentido más general del que visteis en bachillerato.) Tema Bioestadística. U. Málaga. 1: Introdución 18
  • 19. ¿Qué hemos visto?     Definición de estadística Población Muestra Variables    Cualitativas Numéricas Presentación ordenada de datos  Tablas de frecuencias     absolutas relativas acumuladas Representaciones gráficas   Cualitativas Numéricas   Diferenciales Integrales Tema Bioestadística. U. Málaga. 1: Introdución 19