R Code for EM Algorithm

R Code
For
Expectation-Maximization (EM)
Algorithm for Gaussian Mixtures
Avjinder Singh Kaler
This is the R code for EM algorithm. Here, R code is used for 1D, 2D and 3 clusters dataset.
One can modify this code and use for his own project.

Expectation-Maximization (EM) is an iterative
algorithm for finding maximum likelihood estimates of
parameters in statistical models, where the model depends
on unobserved latent variables. The EM iteration alternates
between performing an expectation (E) step, which creates a
function for the expectation of the log-likelihood evaluated
using the current estimate for the parameters, and a
maximization (M) step, which computes parameters
maximizing the expected log-likelihood found on the E step.
Iterate these steps until convergence detect. In simple
language, each iteration consists of an E-step and an M-step.
Convergence is generally detected by computing the value of
the log-likelihood after each iteration and halting when it
appears not to be changing in a significant manner from one
iteration to the next.

#FaithFUL Dataset 1D
#
#load data
#
data(faithful)
Y<-faithful$waiting
#
#plot histogram of waiting times
#
postscript("geyser.eps",width=5,height=3,onefile=F)
par(mar=c(2,2,1,1),mgp=c(1,0.5,0),cex=0.7,lwd=0.5,las=1)
hist(Y,breaks=seq(40,100,3),xlab="Waiting time between eruptions (min)",
xlim=c(40,100),main="",axes=F)
axis(1,seq(40,100,6),pos=0)
axis(2,seq(0,35,5),pos=40,las=1)
dev.off()
#
#log-likelihood function
#
ln<-function(p,Y) {
-sum(log(p[1]*dnorm(Y,p[2],sqrt(p[4]))+(1-p[1])*dnorm(Y,p[3],sqrt(p[5]))))
}
#
#EM algorithm
#
emstep<-function(Y,p) {
EZ<-p[1]*dnorm(Y,p[2],sqrt(p[4]))/
(p[1]*dnorm(Y,p[2],sqrt(p[4]))
+(1-p[1])*dnorm(Y,p[3],sqrt(p[5])))
p[1]<-mean(EZ)
p[2]<-sum(EZ*Y)/sum(EZ)
p[3]<-sum((1-EZ)*Y)/sum(1-EZ)
p[4]<-sum(EZ*(Y-p[2])^2)/sum(EZ)
p[5]<-sum((1-EZ)*(Y-p[3])^2)/sum(1-EZ)
p
}
emiteration<-function(Y,p,n=10) {
for (i in (1:n)) {
p<-emstep(Y,p)
}
p
}
#
#starting values
#
p<-c(0.5,40,90,16,16)
#
#2 iterations of EM algorithm
#
p<-emiteration(Y,p,2)
p
#check for convergence
p<-emstep(Y,p)
p
#
#plot histogram with fitted distribution
#
xlim=c(40,100),
main="",axes=F)
axis(1,seq(40,100,6),pos=0)

x<-seq(40,100,0.1)
y<-p[1]*dnorm(x,p[2],sqrt(p[4]))+(1-p[1])*dnorm(x,p[3],sqrt(p[5]))
lines(x,y*3*length(Y))
#
ln<-function(p,Y) {
}
#
#EM algorithm
#
+(1-p[1])*dnorm(Y,p[3],sqrt(p[5])))
p[1]<-mean(EZ)
p[5]<-sum((1-EZ)*(Y-p[3])^2)/sum(1-EZ)
p
}
for (i in (1:n)) {
p<-emstep(Y,p)
}
p
}
#
#starting values
#
p<-c(0.5,40,90,16,16)
#
#
p
p<-emstep(Y,p)
p
#
#
xlim=c(40,100),
main="",axes=F)
axis(1,seq(40,100,6),pos=0)
x<-seq(40,100,0.1)
#
ln<-function(p,Y) {
}
#
#EM algorithm
#
+(1-p[1])*dnorm(Y,p[3],sqrt(p[5])))

p[1]<-mean(EZ)
p[5]<-sum((1-EZ)*(Y-p[3])^2)/sum(1-EZ)
p
}
for (i in (1:n)) {
p<-emstep(Y,p)
}
p
}
#
#starting values
#
p<-c(0.5,40,90,16,16)
#
#
p
p<-emstep(Y,p)
p
#
#
xlim=c(40,100),
main="",axes=F)
axis(1,seq(40,100,6),pos=0)
x<-seq(40,100,0.1)
#Faithful Dataset 2D
#load data
#
#
#Bivariate mixture model
#
data(faithful)
Y<-faithful$waiting
X<-faithful$eruptions
plot(Y,X,xlab="Waiting time between eruptions (min)",
ylab="Eruption times (min)",
xlim=c(40,100),ylim=c(0,6),
main="",axes=F,cex=0.7)
axis(1,seq(40,100,6),pos=0)
#
#density of bivariate normal
#
dbinorm<-function(x,m,s){
1/sqrt(det(2*pi*s))*exp(-0.5*t(x-m)%*%solve(s)%*%(x-m))
}
f.hat<-function(x,p) {
p$p*dbinorm(x,p$m1,p$s1)+(1-p$p)*dbinorm(x,p$m2,p$s2)
}
Estep<-function(x,p) {
p$p*dbinorm(x,p$m1,p$s1)/

(p$p*dbinorm(x,p$m1,p$s1)
+(1-p$p)*dbinorm(x,p$m2,p$s2))
}
EZ<-apply(Y,1,Estep,p)
p$p<-mean(EZ)
p$m1<-(t(Y)%*%diag(EZ)%*%rep(1,nrow(Y)))/sum(EZ)
p$m2<-(t(Y)%*%diag(1-EZ)%*%rep(1,nrow(Y)))/sum(1-EZ)
MY<-matrix(p$m1,nrow(Y),2,byrow=T)
p$s1<-(t(Y-MY)%*%diag(EZ)%*%(Y-MY))/sum(EZ)
p$s2<-(t(Y-MY)%*%diag(1-EZ)%*%(Y-MY))/sum(1-EZ)
p
}
#----------------------------------
X<-faithful$waiting
Y<-faithful$eruptions
Z<-cbind(X,Y)
#starting values
#
p=p.0<-list(p=0.5,m1=c(20,6),m2=c(70,6),
s1=matrix(c(10,0,0,1),2,2),s2=matrix(c(10,0,0,1),2,2))
#--------------------------------------
lh=NULL
P=matrix(0,20,length(p))
for(i in 1:20){
p<-emiteration(Z,p,i)
lh[i]=sum(log(apply(Z,1,f.hat,p)))
}
plot(lh,type='o',xlab='iterations',ylab='likelihood')
#---------------------------------------
require(ggplot2)
#---Graph the mixture:
n.l=m.l=30
x=seq(40,100,length= n.l)
y=seq(0,6,length = m.l)
xy=as.matrix(expand.grid(x,y))
# 2 Number of Iterations
p=p.0
p<-emiteration(Z,p,2)
z=apply(xy,1,f.hat,p)
z.mat1=matrix(z,n.l,m.l)
#postrior
class.lab1=round(apply(Z,1,Estep,p))
plot(X,Y,xlim=c(40,100),ylim=c(0,6),pch=20,cex=.75,xlab="Waiting time (min)",
ylab='Eruption time (min)',col=class.lab1+2)
contour(x,y,z.mat1,label="", add=T)
title(main=list('iteration = 2',font=3))
p=p.0
#postrior

p=p.0
#postrior
p=p.0
#postrior
p=p.0
#postrior
# Simulated Data for 3 Clusters
#load data
library(mvtnorm)
library(graphics)
library(MASS)
require(ggplot2)
X=rmvnorm(100, mean=c(45,4), sigma=diag(c(2,1)))
Y=rmvnorm(100, mean=c(55,6), sigma=diag(c(2,1)))
U=rmvnorm(100, mean=c(65,7), sigma=diag(c(3,1)))
Z=rbind(X,Y, U)
X11()
km_Z=kmeans(Z,3)$cluster
plot(Z,col=km_Z)
#
ln<-function(p,Y) {
}

#
#EM algorithm
#
+(1-p[1])*dnorm(Y,p[3],sqrt(p[5])))
p[1]<-mean(EZ)
p[5]<-sum((1-EZ)*(Y-p[3])^2)/sum(1-EZ)
p
}
for (i in (1:n)) {
p<-emstep(Y,p)
}
p
}
#density of bivariate normal
#
dbinorm<-function(x,m,s){
1/sqrt(det(2*pi*s))*exp(-0.5*t(x-m)%*%solve(s)%*%(x-m))
}
f.hat<-function(x,p) {
p$p1*dbinorm(x,p$m1,p$s1)+p$p2*dbinorm(x,p$m2,p$s2)+
(1-(p$p1+p$p2))*dbinorm(x, p$m3, p$s3)
}
Estep1<-function(x,p) {
p$p1*dbinorm(x,p$m1,p$s1)/
(p$p1*dbinorm(x,p$m1,p$s1)+p$p2*dbinorm(x,p$m2,p$s2)+
(1-(p$p1+p$p2))*dbinorm(x, p$m3, p$s3))
}
Estep2<-function(x,p){
(1-(p$p1+p$p2))*dbinorm(x, p$m3, p$s3))
}
Estep3<-function(x,p){
p$p3*dbinorm(x, p$m3, p$s3))
}
emstep<-function(Y,p){
EZ1<-apply(Y,1,Estep1,p)
EZ2<-apply(Y,1,Estep2,p)
p$p1<-mean(EZ1)
p$p2<-mean(EZ2)
p$m1<-(t(Y)%*%diag(EZ1)%*%rep(1,nrow(Y)))/sum(EZ1)
p$m2<-(t(Y)%*%diag(EZ2)%*%rep(1,nrow(Y)))/sum(EZ2)
p$m3<-(t(Y)%*%diag(1-(EZ1+EZ2))%*%rep(1,nrow(Y)))/sum(1-(EZ1+EZ2))
p$s1<-(t(Y-MY)%*%diag(EZ1)%*%(Y-MY))/sum(EZ1)
p$s2<-(t(Y-MY)%*%diag(EZ2)%*%(Y-MY))/sum(EZ2)
p$s3<-(t(Y-MY)%*%diag(1-(EZ1+EZ2))%*%(Y-MY))/sum(1-(EZ1+EZ2))
p
}
for (i in (1:n)) {
p<-emstep(Y,p)
}

p
}
#starting values
#
p=p.0<-list(p1=1/3,p2=1/3,p3=1/3,m1=c(45,2),m2=c(60,4),m3=c(70,8),
s1=matrix(c(1,0,0,1),2,2),s2=matrix(c(1,0,0,1),2,2),
s3=matrix(c(1,0,0,1),2,2))
#--------------------------------------
lh=NULL
P=matrix(0,20,length(p))
for(i in 1:20){
p<-emiteration(Z,p,i)
lh[i]=sum(log(apply(Z,1,f.hat,p)))
}
X11()
plot(lh,type='o',xlab='iterations',ylab='likelihood')
#---------------------------------------
#---Graph the mixture:
n.l=m.l=30
x=seq(30,70,length= n.l)
y=seq(0,10,length = m.l)
xy=as.matrix(expand.grid(x,y))
# 1 Number of iterations
p=p.0
#postrior
X11()
class.lab1=round(apply(Z,1,Estep1,p))
plot(Z, col=class.lab1+2)
title(main=list(paste('iteration =', 1, sep=" "),font=3))
p=p.0
#postrior
X11()
p=p.0
#postrior
X11()

p=p.0
#postrior
X11()
p=p.0
#postrior
X11()
p=p.0
#postrior
X11()

R Code for EM Algorithm

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

Similaire à R Code for EM Algorithm

Similaire à R Code for EM Algorithm (20)

Plus de Avjinder (Avi) Kaler

Plus de Avjinder (Avi) Kaler (20)

Dernier

Dernier (20)

R Code for EM Algorithm