pylearn: pylearn/algorithms/rbm.py comparison

comparison pylearn/algorithms/rbm.py @ 544:de6de7c2c54b

merged and changed state to dictionary

author	James Bergstra <bergstrj@iro.umontreal.ca>
date	Mon, 17 Nov 2008 20:05:31 -0500
parents	ee5324c21e60 5b4ccbf022c8
children	40cae12a9bb8

comparison

equal deleted inserted replaced

-:34aba0efa3e9
+:de6de7c2c54b
 import numpy as N
 from ..datasets import make_dataset
 from .minimizer import make_minimizer
 from .stopper import make_stopper
 from ..dbdict.experiment import subdict
-class RBM(module.FancyModule):
+class RBM(T.RModule):
 # is it really necessary to pass ALL of these ? - GD
 def __init__(self,
 nvis=None, nhid=None,
 input=None,
-w=None, hidb=None, visb=None):
+w=None, hidb=None, visb=None,
+seed=0, lr=0.1):
 super(RBM, self).__init__()
+self.nhid, self.nvis = nhid, nvis
+self.lr = lr
 # symbolic theano stuff
 # what about multidimensional inputs/outputs ? do they have to be
 # flattened or should we used tensors instead ?
 self.w = w if w is not None else module.Member(T.dmatrix())
 self.visb = visb if visb is not None else module.Member(T.dvector())
 self.hidb = hidb if hidb is not None else module.Member(T.dvector())
+self.seed = seed;
+# 1-step Markov chain
+vis = T.dmatrix()
+hid = sigmoid(T.dot(vis, self.w) + self.hidb)
+hid_sample = self.random.binomial(T.shape(hid), 1, hid)
+neg_vis = sigmoid(T.dot(hid_sample, self.w.T) + self.visb)
+neg_vis_sample = self.random.binomial(T.shape(neg_vis), 1, neg_vis)
+neg_hid = sigmoid(T.dot(neg_vis_sample, self.w) + self.hidb)
-# 1-step Markov chain
+# function which execute 1-step Markov chain (with and without cd updates)
-self.hid = sigmoid(T.dot(self.w,self.input) + self.hidb)
+self.updownup = module.Method([vis], [hid, neg_vis_sample, neg_hid])
-self.hid_sample = self.hid #TODO: sample!
-self.vis = sigmoid(T.dot(self.w.T, self.hid) + self.visb)
-self.vis_sample = self.vis #TODO: sample!
-self.neg_hid = sigmoid(T.dot(self.w, self.vis) + self.hidb)
-# cd1 updates:
+# function to perform manual cd update given 2 visible and 2 hidden values
-self.params = [self.w, self.visb, self.hidb]
+vistemp = T.dmatrix()
-self.gradients = [
+hidtemp = T.dmatrix()
-T.dot(self.hid, self.input) - T.dot(self.neg_hid, self.vis),
+nvistemp = T.dmatrix()
-self.input - self.vis,
+nhidtemp = T.dmatrix()
-self.hid - self.neg_hid ]
+self.cd_update = module.Method([vistemp, hidtemp, nvistemp, nhidtemp],
+[],
+updates = {self.w: self.w + self.lr *
+(T.dot(vistemp.T, hidtemp) -
+T.dot(nvistemp.T, nhidtemp)),
+self.visb: self.visb + self.lr *
+(T.sum(vistemp - nvistemp,axis=0)),
+self.hidb: self.hidb + self.lr *
+(T.sum(hidtemp - nhidtemp,axis=0))});
-def __instance_initialize(self, obj):
+# TODO: add parameter for weigth initialization
-obj.w = N.random.standard_normal((self.nhid,self.nvis))
+def _instance_initialize(self, obj):
-obj.genb = N.zeros(self.nvis)
+obj.w = N.random.standard_normal((self.nvis,self.nhid))
+obj.visb = N.zeros(self.nvis)
 obj.hidb = N.zeros(self.nhid)
+obj.seed(self.seed);
-def RBM_cd():
+def _instance_cd1(self, obj, input, k=1):
-pass;
+poshid, negvissample, neghid = obj.updownup(input)
+for i in xrange(k-1):
+ahid, negvissample, neghid = obj.updownup(negvissample)
+# CD-k update
+obj.cd_update(input, poshid, negvissample, neghid)
 def train_rbm(state, channel=lambda *args, **kwargs:None):
 dataset = make_dataset(**subdict_copy(state, prefix='dataset_'))
 train = dataset.train
 rbm_module = RBM(
 nvis=train.x.shape[1],
-nhid=state['size_hidden'])
+nhid=state['nhid'])
+rbm = rbm_module.make()
-batchsize = state['batchsize']
+batchsize = state.get('batchsize', 1)
-verbose = state['verbose']
+verbose = state.get('verbose', 1)
 iter = [0]
 while iter[0] != state['max_iters']:
 for j in xrange(0,len(train.x)-batchsize+1,batchsize):
 rbm.cd1(train.x[j:j+batchsize])

Mercurial > pylearn

comparison pylearn/algorithms/rbm.py @ 544:de6de7c2c54b