SlideShare une entreprise Scribd logo
1  sur  19
Lenguaje R: Sesión 7
ING. LUIS FERNANDO AGUAS B
2Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (1)
Fácilmente se pueden calcular estadísticos sumario tipo media, mediana,
desviación, …
> x<-rnorm(50)
> mean(x)
[1] -0.2552258
> sd(x)
[1] 1.209657
> var(x)
[1] 1.463269
> median(x)
[1] -0.3365646
#cuantiles empíricos
> quantile(x)
0% 25% 50% 75% 100%
-3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436
> pvec<-seq(0,1,0.1)
> pvec
[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
> quantile(x,pvec)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
-3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
3Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (2)
#exploramos el dataset juul
> library(ISwR)
> data(juul)
> ?juul
> attach(juul)
> mean(igf1)
[1] NA
Debemos indicarle que no tenga en cuenta los valores missing:
> mean(igf1,na.rm=T)
[1] 340.168
> sd(igf1,na.rm=T)
[1] 171.0356
#una excepción: la función length
> sum(!is.na(igf1))
[1] 1018
#directamente, función summary() sobre cualquier dataset
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000
1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000
Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000
Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896
3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000
Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000
NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
4Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (3)
#en el data frame tenemos variables categóricas
> detach(juul)
> juul$sex<-factor(juul$sex,labels=c("M","F"))
> juul$menarche<-factor(juul$menarche,labels=c("No","Yes"))
> juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V"))
> attach(juul)
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000
1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000
Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000
Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896
3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000
Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000
NA's : 5.000 NA's :321.0 NA's :859.000
#también podríamos haber utilizado la función transform()
> juul<-transform(juul,
+ sex=factor(sex,labels=c("M","F")),
+ menarche=factor(menarche,labels=c("No","Yes")),
+ tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
5Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (1)
#histogramas. Por defecto R, intenta hacer puntos de corte "adecuados"
> hist(x)
6Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (2)
#Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79)
> mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5)
> acc.count<-c(28,46,58,20,31,64,149,316,103)
> age.acc<-rep(mid.age,acc.count)
> brk<-c(0,5,10,16,17,18,20,25,60,80)
> hist(age.acc,breaks=brk)
7Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (3)
#distribución empírica acumulada
> n<-length(x)
> plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
8Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (4)
#qqplot
> qqnorm(x)
9Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (5)
#Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years)
> data(IgM)
> ?IgM
> par(mfrow=c(1,2))
> boxplot(IgM)
> boxplot(log(IgM))
> par(mfrow=c(1,1))
10Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (1)
#Folate concentration in blood cells according to three types of ventilation during
anesthesia
> data(red.cell.folate)
> attach(red.cell.folate)
> ?red.cell.folate
> summary(red.cell.folate)
folate ventilation
Min. :206.0 N2O+O2,24h:8
1st Qu.:249.5 N2O+O2,op :9
Median :274.0 O2,24h :5
Mean :283.2
3rd Qu.:305.5
Max. :392.0
> tapply(folate,ventilation,mean)
N2O+O2,24h N2O+O2,op O2,24h
316.6250 256.4444 278.0000
> #Para tener más de un estadístico resumen por grupo
> m<-tapply(folate,ventilation,mean)
> s<-tapply(folate,ventilation,sd)
> n<-tapply(folate,ventilation,length)
> cbind(mean=m,std.dev=s,n=n)
mean std.dev n
N2O+O2,24h 316.6250 58.71709 8
N2O+O2,op 256.4444 37.12180 9
O2,24h 278.0000 33.75648 5
11Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (2)
#para el dataset juul
> tapply(igf1,tanner,mean)
I II III IV V
NA NA NA NA NA
> tapply(igf1,tanner,mean,na.rm=T)
I II III IV V
207.4727 352.6714 483.2222 513.0172 465.3344
13Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (2)
#boxplots para cada grupo
> boxplot(expend~stature)
> boxplot(expend.lean,expend.obese)
14Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (3)
#con muestras tan pequeñas, los boxplots pueden resultar engañosos
#gráficos de los datos originales, punto a punto
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1)
> stripchart(expend~stature)
> stripchart(expend~stature,method="jitter")
> stripchart(expend~stature,method="stack")
> stripchart(expend~stature,method="stack",jitter=0.03)
> par(opar)
15Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (1)
#Una tabla debe estar en un objecto tipo matriz
#Ejemplo mujeres consumo cafeína vs estado civil
> caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T)
> caff.marital
[,1] [,2] [,3] [,4]
[1,] 652 1537 598 242
[2,] 36 46 38 21
[3,] 218 327 106 67
> colnames(caff.marital)<-c("0","1-150","151-300",">300")
> rownames(caff.marital)<-c("Married","Prev.married","Single")
> caff.marital
0 1-150 151-300 >300
Married 652 1537 598 242
Prev.married 36 46 38 21
Single 218 327 106 67
#también podemos crearla a partir de variables categóricas de un dataset
table(sex)
sex
M F
621 713
> table(sex,menarche)
menarche
sex No Yes
M 0 0
F 369 335
> table(menarche,tanner)
tanner
menarche I II III IV V
No 221 43 32 14 2
Yes 1 1 5 26 202
16Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (2)
#podemos transponer las tablas
> t(caff.marital)
Married Prev.married Single
0 652 36 218
1-150 1537 46 327
151-300 598 38 106
>300 242 21 67
#para calcular las frecuencias marginales, perfiles fila, ...
> tanner.sex<-table(tanner,sex)
> tanner.sex
sex
tanner M F
I 291 224
II 55 48
III 34 38
IV 41 40
V 124 204
> margin.table(tanner.sex,1)
tanner
I II III IV V
515 103 72 81 328
> margin.table(tanner.sex,2)
sex
M F
545 554
> prop.table(tanner.sex,1)
sex
tanner M F
I 0.5650485 0.4349515
II 0.5339806 0.4660194
III 0.4722222 0.5277778
IV 0.5061728 0.4938272
V 0.3780488 0.6219512
> prop.table(tanner.sex,1)*100
sex
tanner M F
I 56.50485 43.49515
II 53.39806 46.60194
III 47.22222 52.77778
IV 50.61728 49.38272
V 37.80488 62.19512
> tanner.sex/sum(tanner.sex)
sex
tanner M F
I 0.26478617 0.20382166
II 0.05004550 0.04367607
III 0.03093722 0.03457689
IV 0.03730664 0.03639672
V 0.11282985 0.18562329
17Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (1)
#diagrama de barras
> total.caff<-margin.table(caff.marital,2)
> total.caff
0 1-150 151-300 >300
906 1910 742 330
> barplot(total.caff,col="white")
18Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (2)
#diagramas de barras para una tabla de contingencia
> par(mfrow=c(2,2))
> barplot(caff.marital,col="white")
> barplot(t(caff.marital),col="white")
> barplot(t(caff.marital),col="white",beside=T)
> barplot(prop.table(t(caff.marital),2),col="white",beside=T)
> par(mfrow=c(1,1))
19Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (3)
#otro diagrama de barras para una tabla de contingencia
> barplot(prop.table(t(caff.marital),2),beside=T,
+ legend.text=colnames(caff.marital),
+ col=c("white","grey80","grey50","black"))
20Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (4)
#diagrama de sectores para una tabla de contingencia
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1))
> slices<-c("white","grey80","grey50","black")
> pie(caff.marital["Married",],main="Married",col=slices)
> pie(caff.marital["Prev.married",],main="Previously married",col=slices)
> pie(caff.marital["Single",],main="Single",col=slices)
> par(opar)

Contenu connexe

En vedette

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...Martín Cabrera
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Software Guru
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaLuis Fernando Aguas Bucheli
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALGuillermo Herrera
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R CommanderFernando Reche
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDDr. Orville M. Disdier
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industriaJorge Medina
 
Costos industriales
Costos industrialesCostos industriales
Costos industrialesyhameille
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RShirley Armas
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operacionesgueste3129d
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básicaVanessa Ortiz
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval Venkata Reddy Konasani
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL WILSON VELASTEGUI
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrioCARLOS MASSUH
 

En vedette (20)

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión Introductoria
 
Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6
 
Introduccion al Programa R
Introduccion al Programa RIntroduccion al Programa R
Introduccion al Programa R
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R Commander
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
 
R- Introduction
R- IntroductionR- Introduction
R- Introduction
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industria
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION R
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operaciones
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básica
 
Step By Step Guide to Learn R
Step By Step Guide to Learn RStep By Step Guide to Learn R
Step By Step Guide to Learn R
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
 
Credit Risk Model Building Steps
Credit Risk Model Building StepsCredit Risk Model Building Steps
Credit Risk Model Building Steps
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrio
 

Similaire à Estadística con Lenguaje R: Sesión 7

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS Juan Carlos Durand
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoyony20
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de EstadisticaWillian Delgado
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaEstadistica1000
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadisticamecufer09
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2danilosaavedra
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v eticmarlopgon14
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Sheyla Caraballo
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
8.estadistica
8.estadistica8.estadistica
8.estadisticafanufe
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mecfruizj
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoBASEK
 

Similaire à Estadística con Lenguaje R: Sesión 7 (20)

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonado
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de Estadistica
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet Estadistica
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadistica
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2
 
Estadistica uts
Estadistica utsEstadistica uts
Estadistica uts
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v etic
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mec
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del Mercado
 
+Reuniónago172014 03
+Reuniónago172014 03+Reuniónago172014 03
+Reuniónago172014 03
 

Plus de Luis Fernando Aguas Bucheli (20)

EFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptxEFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptx
 
P-S2.pptx
P-S2.pptxP-S2.pptx
P-S2.pptx
 
EBTS-S1.pptx
EBTS-S1.pptxEBTS-S1.pptx
EBTS-S1.pptx
 
P-S3.pptx
P-S3.pptxP-S3.pptx
P-S3.pptx
 
EBTS-S4.pptx
EBTS-S4.pptxEBTS-S4.pptx
EBTS-S4.pptx
 
P-S4.pptx
P-S4.pptxP-S4.pptx
P-S4.pptx
 
P-S1.pptx
P-S1.pptxP-S1.pptx
P-S1.pptx
 
EBTS-S3.pptx
EBTS-S3.pptxEBTS-S3.pptx
EBTS-S3.pptx
 
EBTS-S2.pptx
EBTS-S2.pptxEBTS-S2.pptx
EBTS-S2.pptx
 
PDIDTI-S7.pptx
PDIDTI-S7.pptxPDIDTI-S7.pptx
PDIDTI-S7.pptx
 
PDIDTI-S4.pptx
PDIDTI-S4.pptxPDIDTI-S4.pptx
PDIDTI-S4.pptx
 
PDIDTI-S2.pptx
PDIDTI-S2.pptxPDIDTI-S2.pptx
PDIDTI-S2.pptx
 
PDIDTI-S1.pptx
PDIDTI-S1.pptxPDIDTI-S1.pptx
PDIDTI-S1.pptx
 
PDIDTI-S8.pptx
PDIDTI-S8.pptxPDIDTI-S8.pptx
PDIDTI-S8.pptx
 
PDIDTI-S6.pptx
PDIDTI-S6.pptxPDIDTI-S6.pptx
PDIDTI-S6.pptx
 
PDIDTI-S5.pptx
PDIDTI-S5.pptxPDIDTI-S5.pptx
PDIDTI-S5.pptx
 
PDIDTI-S3.pptx
PDIDTI-S3.pptxPDIDTI-S3.pptx
PDIDTI-S3.pptx
 
TIC-S4.pptx
TIC-S4.pptxTIC-S4.pptx
TIC-S4.pptx
 
TIC-S3.pptx
TIC-S3.pptxTIC-S3.pptx
TIC-S3.pptx
 
TIC-S2.pptx
TIC-S2.pptxTIC-S2.pptx
TIC-S2.pptx
 

Dernier

PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxiemerc2024
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOluismii249
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxlclcarmen
 
Factores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfFactores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfJonathanCovena1
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfpatriciaines1993
 
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...Ars Erótica
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Katherine Concepcion Gonzalez
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Juan Martín Martín
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docxEliaHernndez7
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024IES Vicent Andres Estelles
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfGruberACaraballo
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primariaWilian24
 
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...JoseMartinMalpartida1
 

Dernier (20)

Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
Novena de Pentecostés con textos de san Juan Eudes
Novena de Pentecostés con textos de san Juan EudesNovena de Pentecostés con textos de san Juan Eudes
Novena de Pentecostés con textos de san Juan Eudes
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Factores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfFactores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdf
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
 

Estadística con Lenguaje R: Sesión 7

  • 1. Lenguaje R: Sesión 7 ING. LUIS FERNANDO AGUAS B
  • 2. 2Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (1) Fácilmente se pueden calcular estadísticos sumario tipo media, mediana, desviación, … > x<-rnorm(50) > mean(x) [1] -0.2552258 > sd(x) [1] 1.209657 > var(x) [1] 1.463269 > median(x) [1] -0.3365646 #cuantiles empíricos > quantile(x) 0% 25% 50% 75% 100% -3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436 > pvec<-seq(0,1,0.1) > pvec [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 > quantile(x,pvec) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% -3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
  • 3. 3Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (2) #exploramos el dataset juul > library(ISwR) > data(juul) > ?juul > attach(juul) > mean(igf1) [1] NA Debemos indicarle que no tenga en cuenta los valores missing: > mean(igf1,na.rm=T) [1] 340.168 > sd(igf1,na.rm=T) [1] 171.0356 #una excepción: la función length > sum(!is.na(igf1)) [1] 1018 #directamente, función summary() sobre cualquier dataset > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000 1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000 Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000 Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896 3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000 Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000 NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
  • 4. 4Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (3) #en el data frame tenemos variables categóricas > detach(juul) > juul$sex<-factor(juul$sex,labels=c("M","F")) > juul$menarche<-factor(juul$menarche,labels=c("No","Yes")) > juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V")) > attach(juul) > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000 1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000 Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000 Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896 3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000 Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000 NA's : 5.000 NA's :321.0 NA's :859.000 #también podríamos haber utilizado la función transform() > juul<-transform(juul, + sex=factor(sex,labels=c("M","F")), + menarche=factor(menarche,labels=c("No","Yes")), + tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
  • 5. 5Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (1) #histogramas. Por defecto R, intenta hacer puntos de corte "adecuados" > hist(x)
  • 6. 6Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (2) #Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79) > mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5) > acc.count<-c(28,46,58,20,31,64,149,316,103) > age.acc<-rep(mid.age,acc.count) > brk<-c(0,5,10,16,17,18,20,25,60,80) > hist(age.acc,breaks=brk)
  • 7. 7Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (3) #distribución empírica acumulada > n<-length(x) > plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
  • 8. 8Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (4) #qqplot > qqnorm(x)
  • 9. 9Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (5) #Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years) > data(IgM) > ?IgM > par(mfrow=c(1,2)) > boxplot(IgM) > boxplot(log(IgM)) > par(mfrow=c(1,1))
  • 10. 10Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (1) #Folate concentration in blood cells according to three types of ventilation during anesthesia > data(red.cell.folate) > attach(red.cell.folate) > ?red.cell.folate > summary(red.cell.folate) folate ventilation Min. :206.0 N2O+O2,24h:8 1st Qu.:249.5 N2O+O2,op :9 Median :274.0 O2,24h :5 Mean :283.2 3rd Qu.:305.5 Max. :392.0 > tapply(folate,ventilation,mean) N2O+O2,24h N2O+O2,op O2,24h 316.6250 256.4444 278.0000 > #Para tener más de un estadístico resumen por grupo > m<-tapply(folate,ventilation,mean) > s<-tapply(folate,ventilation,sd) > n<-tapply(folate,ventilation,length) > cbind(mean=m,std.dev=s,n=n) mean std.dev n N2O+O2,24h 316.6250 58.71709 8 N2O+O2,op 256.4444 37.12180 9 O2,24h 278.0000 33.75648 5
  • 11. 11Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (2) #para el dataset juul > tapply(igf1,tanner,mean) I II III IV V NA NA NA NA NA > tapply(igf1,tanner,mean,na.rm=T) I II III IV V 207.4727 352.6714 483.2222 513.0172 465.3344
  • 12. 13Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (2) #boxplots para cada grupo > boxplot(expend~stature) > boxplot(expend.lean,expend.obese)
  • 13. 14Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (3) #con muestras tan pequeñas, los boxplots pueden resultar engañosos #gráficos de los datos originales, punto a punto > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1) > stripchart(expend~stature) > stripchart(expend~stature,method="jitter") > stripchart(expend~stature,method="stack") > stripchart(expend~stature,method="stack",jitter=0.03) > par(opar)
  • 14. 15Sesión 7 – Introducción a la estadística básica y gráficos Tablas (1) #Una tabla debe estar en un objecto tipo matriz #Ejemplo mujeres consumo cafeína vs estado civil > caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T) > caff.marital [,1] [,2] [,3] [,4] [1,] 652 1537 598 242 [2,] 36 46 38 21 [3,] 218 327 106 67 > colnames(caff.marital)<-c("0","1-150","151-300",">300") > rownames(caff.marital)<-c("Married","Prev.married","Single") > caff.marital 0 1-150 151-300 >300 Married 652 1537 598 242 Prev.married 36 46 38 21 Single 218 327 106 67 #también podemos crearla a partir de variables categóricas de un dataset table(sex) sex M F 621 713 > table(sex,menarche) menarche sex No Yes M 0 0 F 369 335 > table(menarche,tanner) tanner menarche I II III IV V No 221 43 32 14 2 Yes 1 1 5 26 202
  • 15. 16Sesión 7 – Introducción a la estadística básica y gráficos Tablas (2) #podemos transponer las tablas > t(caff.marital) Married Prev.married Single 0 652 36 218 1-150 1537 46 327 151-300 598 38 106 >300 242 21 67 #para calcular las frecuencias marginales, perfiles fila, ... > tanner.sex<-table(tanner,sex) > tanner.sex sex tanner M F I 291 224 II 55 48 III 34 38 IV 41 40 V 124 204 > margin.table(tanner.sex,1) tanner I II III IV V 515 103 72 81 328 > margin.table(tanner.sex,2) sex M F 545 554 > prop.table(tanner.sex,1) sex tanner M F I 0.5650485 0.4349515 II 0.5339806 0.4660194 III 0.4722222 0.5277778 IV 0.5061728 0.4938272 V 0.3780488 0.6219512 > prop.table(tanner.sex,1)*100 sex tanner M F I 56.50485 43.49515 II 53.39806 46.60194 III 47.22222 52.77778 IV 50.61728 49.38272 V 37.80488 62.19512 > tanner.sex/sum(tanner.sex) sex tanner M F I 0.26478617 0.20382166 II 0.05004550 0.04367607 III 0.03093722 0.03457689 IV 0.03730664 0.03639672 V 0.11282985 0.18562329
  • 16. 17Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (1) #diagrama de barras > total.caff<-margin.table(caff.marital,2) > total.caff 0 1-150 151-300 >300 906 1910 742 330 > barplot(total.caff,col="white")
  • 17. 18Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (2) #diagramas de barras para una tabla de contingencia > par(mfrow=c(2,2)) > barplot(caff.marital,col="white") > barplot(t(caff.marital),col="white") > barplot(t(caff.marital),col="white",beside=T) > barplot(prop.table(t(caff.marital),2),col="white",beside=T) > par(mfrow=c(1,1))
  • 18. 19Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (3) #otro diagrama de barras para una tabla de contingencia > barplot(prop.table(t(caff.marital),2),beside=T, + legend.text=colnames(caff.marital), + col=c("white","grey80","grey50","black"))
  • 19. 20Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (4) #diagrama de sectores para una tabla de contingencia > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1)) > slices<-c("white","grey80","grey50","black") > pie(caff.marital["Married",],main="Married",col=slices) > pie(caff.marital["Prev.married",],main="Previously married",col=slices) > pie(caff.marital["Single",],main="Single",col=slices) > par(opar)