SlideShare une entreprise Scribd logo
1  sur  19
Lenguaje R: Sesión 7
ING. LUIS FERNANDO AGUAS B
2Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (1)
Fácilmente se pueden calcular estadísticos sumario tipo media, mediana,
desviación, …
> x<-rnorm(50)
> mean(x)
[1] -0.2552258
> sd(x)
[1] 1.209657
> var(x)
[1] 1.463269
> median(x)
[1] -0.3365646
#cuantiles empíricos
> quantile(x)
0% 25% 50% 75% 100%
-3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436
> pvec<-seq(0,1,0.1)
> pvec
[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
> quantile(x,pvec)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
-3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
3Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (2)
#exploramos el dataset juul
> library(ISwR)
> data(juul)
> ?juul
> attach(juul)
> mean(igf1)
[1] NA
Debemos indicarle que no tenga en cuenta los valores missing:
> mean(igf1,na.rm=T)
[1] 340.168
> sd(igf1,na.rm=T)
[1] 171.0356
#una excepción: la función length
> sum(!is.na(igf1))
[1] 1018
#directamente, función summary() sobre cualquier dataset
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000
1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000
Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000
Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896
3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000
Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000
NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
4Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (3)
#en el data frame tenemos variables categóricas
> detach(juul)
> juul$sex<-factor(juul$sex,labels=c("M","F"))
> juul$menarche<-factor(juul$menarche,labels=c("No","Yes"))
> juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V"))
> attach(juul)
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000
1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000
Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000
Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896
3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000
Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000
NA's : 5.000 NA's :321.0 NA's :859.000
#también podríamos haber utilizado la función transform()
> juul<-transform(juul,
+ sex=factor(sex,labels=c("M","F")),
+ menarche=factor(menarche,labels=c("No","Yes")),
+ tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
5Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (1)
#histogramas. Por defecto R, intenta hacer puntos de corte "adecuados"
> hist(x)
6Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (2)
#Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79)
> mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5)
> acc.count<-c(28,46,58,20,31,64,149,316,103)
> age.acc<-rep(mid.age,acc.count)
> brk<-c(0,5,10,16,17,18,20,25,60,80)
> hist(age.acc,breaks=brk)
7Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (3)
#distribución empírica acumulada
> n<-length(x)
> plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
8Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (4)
#qqplot
> qqnorm(x)
9Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (5)
#Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years)
> data(IgM)
> ?IgM
> par(mfrow=c(1,2))
> boxplot(IgM)
> boxplot(log(IgM))
> par(mfrow=c(1,1))
10Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (1)
#Folate concentration in blood cells according to three types of ventilation during
anesthesia
> data(red.cell.folate)
> attach(red.cell.folate)
> ?red.cell.folate
> summary(red.cell.folate)
folate ventilation
Min. :206.0 N2O+O2,24h:8
1st Qu.:249.5 N2O+O2,op :9
Median :274.0 O2,24h :5
Mean :283.2
3rd Qu.:305.5
Max. :392.0
> tapply(folate,ventilation,mean)
N2O+O2,24h N2O+O2,op O2,24h
316.6250 256.4444 278.0000
> #Para tener más de un estadístico resumen por grupo
> m<-tapply(folate,ventilation,mean)
> s<-tapply(folate,ventilation,sd)
> n<-tapply(folate,ventilation,length)
> cbind(mean=m,std.dev=s,n=n)
mean std.dev n
N2O+O2,24h 316.6250 58.71709 8
N2O+O2,op 256.4444 37.12180 9
O2,24h 278.0000 33.75648 5
11Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (2)
#para el dataset juul
> tapply(igf1,tanner,mean)
I II III IV V
NA NA NA NA NA
> tapply(igf1,tanner,mean,na.rm=T)
I II III IV V
207.4727 352.6714 483.2222 513.0172 465.3344
13Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (2)
#boxplots para cada grupo
> boxplot(expend~stature)
> boxplot(expend.lean,expend.obese)
14Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (3)
#con muestras tan pequeñas, los boxplots pueden resultar engañosos
#gráficos de los datos originales, punto a punto
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1)
> stripchart(expend~stature)
> stripchart(expend~stature,method="jitter")
> stripchart(expend~stature,method="stack")
> stripchart(expend~stature,method="stack",jitter=0.03)
> par(opar)
15Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (1)
#Una tabla debe estar en un objecto tipo matriz
#Ejemplo mujeres consumo cafeína vs estado civil
> caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T)
> caff.marital
[,1] [,2] [,3] [,4]
[1,] 652 1537 598 242
[2,] 36 46 38 21
[3,] 218 327 106 67
> colnames(caff.marital)<-c("0","1-150","151-300",">300")
> rownames(caff.marital)<-c("Married","Prev.married","Single")
> caff.marital
0 1-150 151-300 >300
Married 652 1537 598 242
Prev.married 36 46 38 21
Single 218 327 106 67
#también podemos crearla a partir de variables categóricas de un dataset
table(sex)
sex
M F
621 713
> table(sex,menarche)
menarche
sex No Yes
M 0 0
F 369 335
> table(menarche,tanner)
tanner
menarche I II III IV V
No 221 43 32 14 2
Yes 1 1 5 26 202
16Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (2)
#podemos transponer las tablas
> t(caff.marital)
Married Prev.married Single
0 652 36 218
1-150 1537 46 327
151-300 598 38 106
>300 242 21 67
#para calcular las frecuencias marginales, perfiles fila, ...
> tanner.sex<-table(tanner,sex)
> tanner.sex
sex
tanner M F
I 291 224
II 55 48
III 34 38
IV 41 40
V 124 204
> margin.table(tanner.sex,1)
tanner
I II III IV V
515 103 72 81 328
> margin.table(tanner.sex,2)
sex
M F
545 554
> prop.table(tanner.sex,1)
sex
tanner M F
I 0.5650485 0.4349515
II 0.5339806 0.4660194
III 0.4722222 0.5277778
IV 0.5061728 0.4938272
V 0.3780488 0.6219512
> prop.table(tanner.sex,1)*100
sex
tanner M F
I 56.50485 43.49515
II 53.39806 46.60194
III 47.22222 52.77778
IV 50.61728 49.38272
V 37.80488 62.19512
> tanner.sex/sum(tanner.sex)
sex
tanner M F
I 0.26478617 0.20382166
II 0.05004550 0.04367607
III 0.03093722 0.03457689
IV 0.03730664 0.03639672
V 0.11282985 0.18562329
17Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (1)
#diagrama de barras
> total.caff<-margin.table(caff.marital,2)
> total.caff
0 1-150 151-300 >300
906 1910 742 330
> barplot(total.caff,col="white")
18Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (2)
#diagramas de barras para una tabla de contingencia
> par(mfrow=c(2,2))
> barplot(caff.marital,col="white")
> barplot(t(caff.marital),col="white")
> barplot(t(caff.marital),col="white",beside=T)
> barplot(prop.table(t(caff.marital),2),col="white",beside=T)
> par(mfrow=c(1,1))
19Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (3)
#otro diagrama de barras para una tabla de contingencia
> barplot(prop.table(t(caff.marital),2),beside=T,
+ legend.text=colnames(caff.marital),
+ col=c("white","grey80","grey50","black"))
20Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (4)
#diagrama de sectores para una tabla de contingencia
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1))
> slices<-c("white","grey80","grey50","black")
> pie(caff.marital["Married",],main="Married",col=slices)
> pie(caff.marital["Prev.married",],main="Previously married",col=slices)
> pie(caff.marital["Single",],main="Single",col=slices)
> par(opar)

Contenu connexe

En vedette

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...Martín Cabrera
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Software Guru
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaLuis Fernando Aguas Bucheli
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALGuillermo Herrera
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R CommanderFernando Reche
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDDr. Orville M. Disdier
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industriaJorge Medina
 
Costos industriales
Costos industrialesCostos industriales
Costos industrialesyhameille
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RShirley Armas
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operacionesgueste3129d
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básicaVanessa Ortiz
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval Venkata Reddy Konasani
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL WILSON VELASTEGUI
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrioCARLOS MASSUH
 

En vedette (20)

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión Introductoria
 
Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6
 
Introduccion al Programa R
Introduccion al Programa RIntroduccion al Programa R
Introduccion al Programa R
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R Commander
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
 
R- Introduction
R- IntroductionR- Introduction
R- Introduction
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industria
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION R
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operaciones
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básica
 
Step By Step Guide to Learn R
Step By Step Guide to Learn RStep By Step Guide to Learn R
Step By Step Guide to Learn R
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
 
Credit Risk Model Building Steps
Credit Risk Model Building StepsCredit Risk Model Building Steps
Credit Risk Model Building Steps
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrio
 

Similaire à Estadística con Lenguaje R: Sesión 7

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS Juan Carlos Durand
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoyony20
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de EstadisticaWillian Delgado
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaEstadistica1000
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadisticamecufer09
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2danilosaavedra
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v eticmarlopgon14
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Sheyla Caraballo
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mecfruizj
 
8.estadistica
8.estadistica8.estadistica
8.estadisticafanufe
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoBASEK
 

Similaire à Estadística con Lenguaje R: Sesión 7 (20)

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonado
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de Estadistica
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet Estadistica
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadistica
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2
 
Estadistica uts
Estadistica utsEstadistica uts
Estadistica uts
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v etic
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mec
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del Mercado
 
+Reuniónago172014 03
+Reuniónago172014 03+Reuniónago172014 03
+Reuniónago172014 03
 

Plus de Luis Fernando Aguas Bucheli (20)

EFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptxEFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptx
 
P-S2.pptx
P-S2.pptxP-S2.pptx
P-S2.pptx
 
EBTS-S1.pptx
EBTS-S1.pptxEBTS-S1.pptx
EBTS-S1.pptx
 
P-S3.pptx
P-S3.pptxP-S3.pptx
P-S3.pptx
 
EBTS-S4.pptx
EBTS-S4.pptxEBTS-S4.pptx
EBTS-S4.pptx
 
P-S4.pptx
P-S4.pptxP-S4.pptx
P-S4.pptx
 
P-S1.pptx
P-S1.pptxP-S1.pptx
P-S1.pptx
 
EBTS-S3.pptx
EBTS-S3.pptxEBTS-S3.pptx
EBTS-S3.pptx
 
EBTS-S2.pptx
EBTS-S2.pptxEBTS-S2.pptx
EBTS-S2.pptx
 
PDIDTI-S7.pptx
PDIDTI-S7.pptxPDIDTI-S7.pptx
PDIDTI-S7.pptx
 
PDIDTI-S4.pptx
PDIDTI-S4.pptxPDIDTI-S4.pptx
PDIDTI-S4.pptx
 
PDIDTI-S2.pptx
PDIDTI-S2.pptxPDIDTI-S2.pptx
PDIDTI-S2.pptx
 
PDIDTI-S1.pptx
PDIDTI-S1.pptxPDIDTI-S1.pptx
PDIDTI-S1.pptx
 
PDIDTI-S8.pptx
PDIDTI-S8.pptxPDIDTI-S8.pptx
PDIDTI-S8.pptx
 
PDIDTI-S6.pptx
PDIDTI-S6.pptxPDIDTI-S6.pptx
PDIDTI-S6.pptx
 
PDIDTI-S5.pptx
PDIDTI-S5.pptxPDIDTI-S5.pptx
PDIDTI-S5.pptx
 
PDIDTI-S3.pptx
PDIDTI-S3.pptxPDIDTI-S3.pptx
PDIDTI-S3.pptx
 
TIC-S4.pptx
TIC-S4.pptxTIC-S4.pptx
TIC-S4.pptx
 
TIC-S3.pptx
TIC-S3.pptxTIC-S3.pptx
TIC-S3.pptx
 
TIC-S2.pptx
TIC-S2.pptxTIC-S2.pptx
TIC-S2.pptx
 

Dernier

BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATRBIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATRDanielGrajeda7
 
Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024sergeycrastz06
 
Tema 8 Estructura y composición de la Tierra 2024
Tema 8 Estructura y composición de la Tierra 2024Tema 8 Estructura y composición de la Tierra 2024
Tema 8 Estructura y composición de la Tierra 2024IES Vicent Andres Estelles
 
5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdf
5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdf5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdf
5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdfFlorHernandezNuez
 
11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptx
11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptx11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptx
11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptxFESARAUGUSTOFANDIORI
 
el poder del estado en el siglo XXI.pptx
el poder del estado en el siglo XXI.pptxel poder del estado en el siglo XXI.pptx
el poder del estado en el siglo XXI.pptxsubfabian
 
Comunidades Virtuales de Aprendizaje Caracteristicas.pptx
Comunidades Virtuales de Aprendizaje Caracteristicas.pptxComunidades Virtuales de Aprendizaje Caracteristicas.pptx
Comunidades Virtuales de Aprendizaje Caracteristicas.pptxJunkotantik
 
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSALLA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSALJorge Castillo
 
PLAN DE GESTION DEL RIESGO 2023 - 2024.docx
PLAN DE GESTION DEL RIESGO  2023 - 2024.docxPLAN DE GESTION DEL RIESGO  2023 - 2024.docx
PLAN DE GESTION DEL RIESGO 2023 - 2024.docxpily R.T.
 
2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docxCarlosEnriqueArgoteC
 
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdfPasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdfNELLYKATTY
 
TERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docx
TERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docxTERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docx
TERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docxlitaroxselyperezmont
 
LA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIA
LA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIALA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIA
LA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIASandra Mariela Ballón Aguedo
 
Tipologías de vínculos afectivos (grupo)
Tipologías de vínculos afectivos (grupo)Tipologías de vínculos afectivos (grupo)
Tipologías de vínculos afectivos (grupo)portafoliodigitalyos
 
ACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLA
ACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLAACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLA
ACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
PROBLEMAS DE GENÉTICA CON ÁRBOLES GENEALÓGICOS.pdf
PROBLEMAS DE GENÉTICA  CON ÁRBOLES GENEALÓGICOS.pdfPROBLEMAS DE GENÉTICA  CON ÁRBOLES GENEALÓGICOS.pdf
PROBLEMAS DE GENÉTICA CON ÁRBOLES GENEALÓGICOS.pdfmihayedo
 

Dernier (20)

BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATRBIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
BIENESTAR TOTAL - LA EXPERIENCIA DEL CLIENTE CON ATR
 
Sesión de clase: Luz desde el santuario.pdf
Sesión de clase: Luz desde el santuario.pdfSesión de clase: Luz desde el santuario.pdf
Sesión de clase: Luz desde el santuario.pdf
 
Revista Faro Normalista 6, 18 de mayo 2024
Revista Faro Normalista 6, 18 de mayo 2024Revista Faro Normalista 6, 18 de mayo 2024
Revista Faro Normalista 6, 18 de mayo 2024
 
Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024Seguridad y virus informáticos 12°B 2024
Seguridad y virus informáticos 12°B 2024
 
Tema 8 Estructura y composición de la Tierra 2024
Tema 8 Estructura y composición de la Tierra 2024Tema 8 Estructura y composición de la Tierra 2024
Tema 8 Estructura y composición de la Tierra 2024
 
5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdf
5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdf5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdf
5º PARTE 3 SOY LECTOR -MD EDUCATIVO_240418_155445 (1).pdf
 
11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptx
11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptx11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptx
11.NEOLIBERALISMO: que es, ventajas, desventajas, consecuenciaspptx
 
el poder del estado en el siglo XXI.pptx
el poder del estado en el siglo XXI.pptxel poder del estado en el siglo XXI.pptx
el poder del estado en el siglo XXI.pptx
 
Comunidades Virtuales de Aprendizaje Caracteristicas.pptx
Comunidades Virtuales de Aprendizaje Caracteristicas.pptxComunidades Virtuales de Aprendizaje Caracteristicas.pptx
Comunidades Virtuales de Aprendizaje Caracteristicas.pptx
 
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSALLA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
LA ILIADA Y LA ODISEA.LITERATURA UNIVERSAL
 
La historia de la vida estudiantil a 102 años de la fundación de las Normales...
La historia de la vida estudiantil a 102 años de la fundación de las Normales...La historia de la vida estudiantil a 102 años de la fundación de las Normales...
La historia de la vida estudiantil a 102 años de la fundación de las Normales...
 
PLAN DE GESTION DEL RIESGO 2023 - 2024.docx
PLAN DE GESTION DEL RIESGO  2023 - 2024.docxPLAN DE GESTION DEL RIESGO  2023 - 2024.docx
PLAN DE GESTION DEL RIESGO 2023 - 2024.docx
 
2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx2.15. Calendario Civico Escolar 2024.docx
2.15. Calendario Civico Escolar 2024.docx
 
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdfPasos para enviar una tarea en SIANET - sólo estudiantes.pdf
Pasos para enviar una tarea en SIANET - sólo estudiantes.pdf
 
TERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docx
TERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docxTERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docx
TERCER GRADO PROGRAMACION ANUAL CCSS 3° - 2024.docx
 
LA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIA
LA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIALA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIA
LA GEOMETRÍA Y LOS SISTEMAS ANGULARES, APRENDER LEYENDO LA BIBLIA
 
Tipologías de vínculos afectivos (grupo)
Tipologías de vínculos afectivos (grupo)Tipologías de vínculos afectivos (grupo)
Tipologías de vínculos afectivos (grupo)
 
ACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLA
ACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLAACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLA
ACERTIJO SOPA DE LETRAS OLÍMPICA. Por JAVIER SOLIS NOYOLA
 
PROBLEMAS DE GENÉTICA CON ÁRBOLES GENEALÓGICOS.pdf
PROBLEMAS DE GENÉTICA  CON ÁRBOLES GENEALÓGICOS.pdfPROBLEMAS DE GENÉTICA  CON ÁRBOLES GENEALÓGICOS.pdf
PROBLEMAS DE GENÉTICA CON ÁRBOLES GENEALÓGICOS.pdf
 
Power Point: Luz desde el santuario.pptx
Power Point: Luz desde el santuario.pptxPower Point: Luz desde el santuario.pptx
Power Point: Luz desde el santuario.pptx
 

Estadística con Lenguaje R: Sesión 7

  • 1. Lenguaje R: Sesión 7 ING. LUIS FERNANDO AGUAS B
  • 2. 2Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (1) Fácilmente se pueden calcular estadísticos sumario tipo media, mediana, desviación, … > x<-rnorm(50) > mean(x) [1] -0.2552258 > sd(x) [1] 1.209657 > var(x) [1] 1.463269 > median(x) [1] -0.3365646 #cuantiles empíricos > quantile(x) 0% 25% 50% 75% 100% -3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436 > pvec<-seq(0,1,0.1) > pvec [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 > quantile(x,pvec) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% -3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
  • 3. 3Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (2) #exploramos el dataset juul > library(ISwR) > data(juul) > ?juul > attach(juul) > mean(igf1) [1] NA Debemos indicarle que no tenga en cuenta los valores missing: > mean(igf1,na.rm=T) [1] 340.168 > sd(igf1,na.rm=T) [1] 171.0356 #una excepción: la función length > sum(!is.na(igf1)) [1] 1018 #directamente, función summary() sobre cualquier dataset > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000 1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000 Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000 Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896 3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000 Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000 NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
  • 4. 4Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (3) #en el data frame tenemos variables categóricas > detach(juul) > juul$sex<-factor(juul$sex,labels=c("M","F")) > juul$menarche<-factor(juul$menarche,labels=c("No","Yes")) > juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V")) > attach(juul) > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000 1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000 Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000 Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896 3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000 Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000 NA's : 5.000 NA's :321.0 NA's :859.000 #también podríamos haber utilizado la función transform() > juul<-transform(juul, + sex=factor(sex,labels=c("M","F")), + menarche=factor(menarche,labels=c("No","Yes")), + tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
  • 5. 5Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (1) #histogramas. Por defecto R, intenta hacer puntos de corte "adecuados" > hist(x)
  • 6. 6Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (2) #Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79) > mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5) > acc.count<-c(28,46,58,20,31,64,149,316,103) > age.acc<-rep(mid.age,acc.count) > brk<-c(0,5,10,16,17,18,20,25,60,80) > hist(age.acc,breaks=brk)
  • 7. 7Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (3) #distribución empírica acumulada > n<-length(x) > plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
  • 8. 8Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (4) #qqplot > qqnorm(x)
  • 9. 9Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (5) #Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years) > data(IgM) > ?IgM > par(mfrow=c(1,2)) > boxplot(IgM) > boxplot(log(IgM)) > par(mfrow=c(1,1))
  • 10. 10Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (1) #Folate concentration in blood cells according to three types of ventilation during anesthesia > data(red.cell.folate) > attach(red.cell.folate) > ?red.cell.folate > summary(red.cell.folate) folate ventilation Min. :206.0 N2O+O2,24h:8 1st Qu.:249.5 N2O+O2,op :9 Median :274.0 O2,24h :5 Mean :283.2 3rd Qu.:305.5 Max. :392.0 > tapply(folate,ventilation,mean) N2O+O2,24h N2O+O2,op O2,24h 316.6250 256.4444 278.0000 > #Para tener más de un estadístico resumen por grupo > m<-tapply(folate,ventilation,mean) > s<-tapply(folate,ventilation,sd) > n<-tapply(folate,ventilation,length) > cbind(mean=m,std.dev=s,n=n) mean std.dev n N2O+O2,24h 316.6250 58.71709 8 N2O+O2,op 256.4444 37.12180 9 O2,24h 278.0000 33.75648 5
  • 11. 11Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (2) #para el dataset juul > tapply(igf1,tanner,mean) I II III IV V NA NA NA NA NA > tapply(igf1,tanner,mean,na.rm=T) I II III IV V 207.4727 352.6714 483.2222 513.0172 465.3344
  • 12. 13Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (2) #boxplots para cada grupo > boxplot(expend~stature) > boxplot(expend.lean,expend.obese)
  • 13. 14Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (3) #con muestras tan pequeñas, los boxplots pueden resultar engañosos #gráficos de los datos originales, punto a punto > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1) > stripchart(expend~stature) > stripchart(expend~stature,method="jitter") > stripchart(expend~stature,method="stack") > stripchart(expend~stature,method="stack",jitter=0.03) > par(opar)
  • 14. 15Sesión 7 – Introducción a la estadística básica y gráficos Tablas (1) #Una tabla debe estar en un objecto tipo matriz #Ejemplo mujeres consumo cafeína vs estado civil > caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T) > caff.marital [,1] [,2] [,3] [,4] [1,] 652 1537 598 242 [2,] 36 46 38 21 [3,] 218 327 106 67 > colnames(caff.marital)<-c("0","1-150","151-300",">300") > rownames(caff.marital)<-c("Married","Prev.married","Single") > caff.marital 0 1-150 151-300 >300 Married 652 1537 598 242 Prev.married 36 46 38 21 Single 218 327 106 67 #también podemos crearla a partir de variables categóricas de un dataset table(sex) sex M F 621 713 > table(sex,menarche) menarche sex No Yes M 0 0 F 369 335 > table(menarche,tanner) tanner menarche I II III IV V No 221 43 32 14 2 Yes 1 1 5 26 202
  • 15. 16Sesión 7 – Introducción a la estadística básica y gráficos Tablas (2) #podemos transponer las tablas > t(caff.marital) Married Prev.married Single 0 652 36 218 1-150 1537 46 327 151-300 598 38 106 >300 242 21 67 #para calcular las frecuencias marginales, perfiles fila, ... > tanner.sex<-table(tanner,sex) > tanner.sex sex tanner M F I 291 224 II 55 48 III 34 38 IV 41 40 V 124 204 > margin.table(tanner.sex,1) tanner I II III IV V 515 103 72 81 328 > margin.table(tanner.sex,2) sex M F 545 554 > prop.table(tanner.sex,1) sex tanner M F I 0.5650485 0.4349515 II 0.5339806 0.4660194 III 0.4722222 0.5277778 IV 0.5061728 0.4938272 V 0.3780488 0.6219512 > prop.table(tanner.sex,1)*100 sex tanner M F I 56.50485 43.49515 II 53.39806 46.60194 III 47.22222 52.77778 IV 50.61728 49.38272 V 37.80488 62.19512 > tanner.sex/sum(tanner.sex) sex tanner M F I 0.26478617 0.20382166 II 0.05004550 0.04367607 III 0.03093722 0.03457689 IV 0.03730664 0.03639672 V 0.11282985 0.18562329
  • 16. 17Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (1) #diagrama de barras > total.caff<-margin.table(caff.marital,2) > total.caff 0 1-150 151-300 >300 906 1910 742 330 > barplot(total.caff,col="white")
  • 17. 18Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (2) #diagramas de barras para una tabla de contingencia > par(mfrow=c(2,2)) > barplot(caff.marital,col="white") > barplot(t(caff.marital),col="white") > barplot(t(caff.marital),col="white",beside=T) > barplot(prop.table(t(caff.marital),2),col="white",beside=T) > par(mfrow=c(1,1))
  • 18. 19Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (3) #otro diagrama de barras para una tabla de contingencia > barplot(prop.table(t(caff.marital),2),beside=T, + legend.text=colnames(caff.marital), + col=c("white","grey80","grey50","black"))
  • 19. 20Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (4) #diagrama de sectores para una tabla de contingencia > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1)) > slices<-c("white","grey80","grey50","black") > pie(caff.marital["Married",],main="Married",col=slices) > pie(caff.marital["Prev.married",],main="Previously married",col=slices) > pie(caff.marital["Single",],main="Single",col=slices) > par(opar)