pylearn: mlp.py annotate

annotate mlp.py @ 179:9911d2cc3c01

merged

author	James Bergstra <bergstrj@iro.umontreal.ca>
date	Tue, 13 May 2008 15:14:04 -0400
parents	4090779e39a9 e9a95e19e6f8
children	2698c0feeb54

rev	line source
132 f6505ec32dc3 Updated documentation slightly Joseph Turian <turian@gmail.com> parents: 129 diff changeset	1 """
f6505ec32dc3 Updated documentation slightly Joseph Turian <turian@gmail.com> parents: 129 diff changeset	2 A straightforward classicial feedforward
f6505ec32dc3 Updated documentation slightly Joseph Turian <turian@gmail.com> parents: 129 diff changeset	3 one-hidden-layer neural net, with L2 regularization.
f6505ec32dc3 Updated documentation slightly Joseph Turian <turian@gmail.com> parents: 129 diff changeset	4 This is one of the simplest example of L{Learner}, and illustrates
f6505ec32dc3 Updated documentation slightly Joseph Turian <turian@gmail.com> parents: 129 diff changeset	5 the use of theano.
f6505ec32dc3 Updated documentation slightly Joseph Turian <turian@gmail.com> parents: 129 diff changeset	6 """
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	7
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	8 from learner import *
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	9 from theano import tensor as t
118 d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	10 from nnet_ops import *
133 b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	11 import math
175 e9a95e19e6f8 Added a Print Op Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 155 diff changeset	12 from misc import *
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	13
129 4c2280edcaf5 Fixed typos in learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 126 diff changeset	14 class OneHiddenLayerNNetClassifier(OnlineGradientTLearner):
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	15 """
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	16 Implement a straightforward classicial feedforward
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	17 one-hidden-layer neural net, with L2 regularization.
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	18
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	19 The predictor parameters are obtained by minibatch/online gradient descent.
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	20 Training can proceed sequentially (with multiple calls to update with
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	21 different disjoint subsets of the training sets).
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	22
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	23 Hyper-parameters:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	24 - L2_regularizer
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	25 - learning_rate
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	26 - n_hidden
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	27
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	28 For each (input_t,output_t) pair in a minibatch,::
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	29
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	30 output_activations_t = b2+W2tanh(b1+W1input_t)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	31 output_t = softmax(output_activations_t)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	32 output_class_t = argmax(output_activations_t)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	33 class_error_t = 1_{output_class_t != target_t}
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	34 nll_t = -log(output_t[target_t])
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	35
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	36 and the training criterion is::
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	37
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	38 loss = L2_regularizer*(\|\|W1\|\|^2 + \|\|W2\|\|^2) + sum_t nll_t
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	39
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	40 The parameters are [b1,W1,b2,W2] and are obtained by minimizing the loss by
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	41 stochastic minibatch gradient descent::
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	42
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	43 parameters[i] -= learning_rate * dloss/dparameters[i]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	44
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	45 The fields and attributes expected and produced by use and update are the following:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	46
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	47 - Input and output fields (example-wise quantities):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	48
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	49 - 'input' (always expected by use and update)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	50 - 'target' (optionally expected by use and always by update)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	51 - 'output' (optionally produced by use)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	52 - 'output_class' (optionally produced by use)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	53 - 'class_error' (optionally produced by use)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	54 - 'nll' (optionally produced by use)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	55
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	56 - optional attributes (optionally expected as input_dataset attributes)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	57 (warning, this may be dangerous, the 'use' method will use those provided in the
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	58 input_dataset rather than those learned during 'update'; currently no support
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	59 for providing these to update):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	60
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	61 - 'L2_regularizer'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	62 - 'b1'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	63 - 'W1'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	64 - 'b2'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	65 - 'W2'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	66 - 'parameters' = [b1, W1, b2, W2]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	67 - 'regularization_term'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	68
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	69 """
134 3f4e5c9bdc5e Fixes to ApplyFunctionDataSet and other things to make learner and mlp work Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 133 diff changeset	70 def __init__(self,n_hidden,n_classes,learning_rate,max_n_epochs,L2_regularizer=0,init_range=1.,n_inputs=None,minibatch_size=None):
133 b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	71 self._n_inputs = n_inputs
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	72 self._n_outputs = n_classes
2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	73 self._n_hidden = n_hidden
2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	74 self._init_range = init_range
133 b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	75 self._max_n_epochs = max_n_epochs
b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	76 self._minibatch_size = minibatch_size
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	77 self.learning_rate = learning_rate # this is the float
134 3f4e5c9bdc5e Fixes to ApplyFunctionDataSet and other things to make learner and mlp work Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 133 diff changeset	78 self.L2_regularizer = L2_regularizer
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	79 self._learning_rate = t.scalar('learning_rate') # this is the symbol
2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	80 self._input = t.matrix('input') # n_examples x n_inputs
134 3f4e5c9bdc5e Fixes to ApplyFunctionDataSet and other things to make learner and mlp work Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 133 diff changeset	81 self._target = t.imatrix('target') # n_examples x 1
3f4e5c9bdc5e Fixes to ApplyFunctionDataSet and other things to make learner and mlp work Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 133 diff changeset	82 self._target_vector = self._target[:,0]
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	83 self._L2_regularizer = t.scalar('L2_regularizer')
2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	84 self._W1 = t.matrix('W1')
2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	85 self._W2 = t.matrix('W2')
2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	86 self._b1 = t.row('b1')
2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	87 self._b2 = t.row('b2')
126 4efe6d36c061 minor edits Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 121 diff changeset	88 self._regularization_term = self._L2_regularizer * (t.sum(self._W1self._W1) + t.sum(self._W2self._W2))
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	89 self._output_activations =self._b2+t.dot(t.tanh(self._b1+t.dot(self._input,self._W1.T)),self._W2.T)
175 e9a95e19e6f8 Added a Print Op Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 155 diff changeset	90 self._nll,self._output = crossentropy_softmax_1hot(Print("output_activations")(self._output_activations),self._target_vector)
155 ae5651a3696b new argmax calling convention James Bergstra <bergstrj@iro.umontreal.ca> parents: 134 diff changeset	91 self._output_class = t.argmax(self._output,1)
134 3f4e5c9bdc5e Fixes to ApplyFunctionDataSet and other things to make learner and mlp work Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 133 diff changeset	92 self._class_error = t.neq(self._output_class,self._target_vector)
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	93 self._minibatch_criterion = self._nll + self._regularization_term / t.shape(self._input)[0]
129 4c2280edcaf5 Fixed typos in learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 126 diff changeset	94 OnlineGradientTLearner.__init__(self)
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	95
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	96 def attributeNames(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	97 return ["parameters","b1","W2","b2","W2", "L2_regularizer","regularization_term"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	98
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	99 def parameterAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	100 return ["b1","W1", "b2", "W2"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	101
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	102 def updateMinibatchInputFields(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	103 return ["input","target"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	104
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	105 def updateEndOutputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	106 return ["regularization_term"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	107
118 d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	108 def lossAttribute(self):
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	109 return "minibatch_criterion"
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	110
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	111 def defaultOutputFields(self, input_fields):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	112 output_fields = ["output", "output_class",]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	113 if "target" in input_fields:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	114 output_fields += ["class_error", "nll"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	115 return output_fields
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	116
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	117 def allocate(self,minibatch):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	118 minibatch_n_inputs = minibatch["input"].shape[1]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	119 if not self._n_inputs:
118 d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	120 self._n_inputs = minibatch_n_inputs
134 3f4e5c9bdc5e Fixes to ApplyFunctionDataSet and other things to make learner and mlp work Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 133 diff changeset	121 self.b1 = numpy.zeros((1,self._n_hidden))
3f4e5c9bdc5e Fixes to ApplyFunctionDataSet and other things to make learner and mlp work Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 133 diff changeset	122 self.b2 = numpy.zeros((1,self._n_outputs))
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	123 self.forget()
118 d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	124 elif self._n_inputs!=minibatch_n_inputs:
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	125 # if the input changes dimension on the fly, we resize and forget everything
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	126 self.forget()
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	127
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	128 def forget(self):
118 d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	129 if self._n_inputs:
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	130 r = self._init_range/math.sqrt(self._n_inputs)
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	131 self.W1 = numpy.random.uniform(low=-r,high=r,
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	132 size=(self._n_hidden,self._n_inputs))
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	133 r = self._init_range/math.sqrt(self._n_hidden)
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	134 self.W2 = numpy.random.uniform(low=-r,high=r,
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	135 size=(self._n_outputs,self._n_hidden))
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	136 self.b1[:]=0
d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	137 self.b2[:]=0
133 b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	138 self._n_epochs=0
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	139
133 b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	140 def isLastEpoch(self):
b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	141 self._n_epochs +=1
b4657441dd65 Corrected typos Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 132 diff changeset	142 return self._n_epochs>=self._max_n_epochs
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	143
178 4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	144 def updateMinibatch(self,minibatch):
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	145 # make sure all required fields are allocated and initialized
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	146 self.allocate(minibatch)
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	147 input_attributes = self.names2attributes(self.updateMinibatchInputAttributes())
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	148 input_fields = minibatch(*self.updateMinibatchInputFields())
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	149 print 'input attributes', input_attributes
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	150 print 'input fields', input_fields
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	151 results = self.update_minibatch_function(*(input_attributes+input_fields))
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	152 print 'output attributes', self.updateMinibatchOutputAttributes()
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	153 print 'results', results
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	154 self.setAttributes(self.updateMinibatchOutputAttributes(),
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	155 results)
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	156
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	157 if 0:
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	158 print 'n0', self.names2OpResults(self.updateMinibatchOutputAttributes()+ self.updateMinibatchInputFields())
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	159 print 'n1', self.names2OpResults(self.updateMinibatchOutputAttributes())
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	160 print 'n2', self.names2OpResults(self.updateEndInputAttributes())
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	161 print 'n3', self.names2OpResults(self.updateEndOutputAttributes())
4090779e39a9 merged James Bergstra <bergstrj@iro.umontreal.ca> parents: 155 diff changeset	162
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	163 class MLP(MinibatchUpdatesTLearner):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	164 """
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	165 Implement a feedforward multi-layer perceptron, with or without L1 and/or L2 regularization.
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	166
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	167 The predictor parameters are obtained by minibatch/online gradient descent.
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	168 Training can proceed sequentially (with multiple calls to update with
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	169 different disjoint subsets of the training sets).
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	170
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	171 Hyper-parameters:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	172 - L1_regularizer
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	173 - L2_regularizer
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	174 - neuron_sparsity_regularizer
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	175 - initial_learning_rate
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	176 - learning_rate_decrease_rate
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	177 - n_hidden_per_layer (a list of integers)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	178 - activation_function ("sigmoid","tanh", or "ratio")
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	179
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	180 The output/task type (classification, regression, etc.) is obtained by specializing MLP.
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	181
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	182 For each (input[t],output[t]) pair in a minibatch,::
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	183
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	184 activation[0] = input_t
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	185 for k=1 to n_hidden_layers:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	186 activation[k]=activation_function(b[k]+ W[k]*activation[k-1])
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	187 output_t = output_activation_function(b[n_hidden_layers+1]+W[n_hidden_layers+1]*activation[n_hidden_layers])
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	188
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	189 and the b and W are obtained by minimizing the following by stochastic minibatch gradient descent::
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	190
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	191 L2_regularizer sum_{ijk} W_{kij}^2 + L1_regularizer sum_{kij} \|W_{kij}\|
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	192 + neuron_sparsity_regularizer sum_{ki} \|b_{ki} + infinity\|
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	193 - sum_t log P_{output_model}(target_t \| output_t)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	194
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	195 The fields and attributes expected and produced by use and update are the following:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	196
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	197 - Input and output fields (example-wise quantities):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	198
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	199 - 'input' (always expected by use and update)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	200 - 'target' (optionally expected by use and always by update)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	201 - 'output' (optionally produced by use)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	202 - error fields produced by sub-class of MLP
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	203
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	204 - optional attributes (optionally expected as input_dataset attributes)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	205 (warning, this may be dangerous, the 'use' method will use those provided in the
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	206 input_dataset rather than those learned during 'update'; currently no support
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	207 for providing these to update):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	208
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	209 - 'L1_regularizer'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	210 - 'L2_regularizer'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	211 - 'b'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	212 - 'W'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	213 - 'parameters' = [b[1], W[1], b[2], W[2], ...]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	214 - 'regularization_term'
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	215
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	216 """
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	217
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	218 def attributeNames(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	219 return ["parameters","b","W","L1_regularizer","L2_regularizer","neuron_sparsity_regularizer","regularization_term"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	220
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	221 def useInputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	222 return ["b","W"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	223
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	224 def useOutputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	225 return []
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	226
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	227 def updateInputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	228 return ["b","W","L1_regularizer","L2_regularizer","neuron_sparsity_regularizer"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	229
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	230 def updateMinibatchInputFields(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	231 return ["input","target"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	232
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	233 def updateMinibatchInputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	234 return ["b","W"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	235
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	236 def updateMinibatchOutputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	237 return ["new_XtX","new_XtY"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	238
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	239 def updateEndInputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	240 return ["theta","XtX","XtY"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	241
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	242 def updateEndOutputAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	243 return ["new_theta","b","W","regularization_term"] # CHECK: WILL b AND W CONTAIN OLD OR NEW THETA? @todo i.e. order of computation = ?
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	244
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	245 def parameterAttributes(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	246 return ["b","W"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	247
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	248 def defaultOutputFields(self, input_fields):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	249 output_fields = ["output"]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	250 if "target" in input_fields:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	251 output_fields.append("squared_error")
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	252 return output_fields
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	253
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	254 def __init__(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	255 self._input = t.matrix('input') # n_examples x n_inputs
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	256 self._target = t.matrix('target') # n_examples x n_outputs
121 2ca8dccba270 debugging mlp.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 118 diff changeset	257 self._L2_regularizer = t.scalar('L2_regularizer')
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	258 self._theta = t.matrix('theta')
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	259 self._W = self._theta[:,1:]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	260 self._b = self._theta[:,0]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	261 self._XtX = t.matrix('XtX')
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	262 self._XtY = t.matrix('XtY')
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	263 self._extended_input = t.prepend_one_to_each_row(self._input)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	264 self._output = t.dot(self._input,self._W.T) + self._b # (n_examples , n_outputs) matrix
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	265 self._squared_error = t.sum_within_rows(t.sqr(self._output-self._target)) # (n_examples ) vector
118 d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	266 self._regularizer = self._L2_regularizer * t.dot(self._W,self._W)
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	267 self._new_XtX = add_inplace(self._XtX,t.dot(self._extended_input.T,self._extended_input))
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	268 self._new_XtY = add_inplace(self._XtY,t.dot(self._extended_input.T,self._target))
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	269 self._new_theta = t.solve_inplace(self._theta,self._XtX,self._XtY)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	270
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	271 OneShotTLearner.__init__(self)
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	272
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	273 def allocate(self,minibatch):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	274 minibatch_n_inputs = minibatch["input"].shape[1]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	275 minibatch_n_outputs = minibatch["target"].shape[1]
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	276 if not self._n_inputs:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	277 self._n_inputs = minibatch_n_inputs
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	278 self._n_outputs = minibatch_n_outputs
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	279 self.XtX = numpy.zeros((1+self._n_inputs,1+self._n_inputs))
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	280 self.XtY = numpy.zeros((1+self._n_inputs,self._n_outputs))
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	281 self.theta = numpy.zeros((self._n_outputs,1+self._n_inputs))
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	282 self.forget()
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	283 elif self._n_inputs!=minibatch_n_inputs or self._n_outputs!=minibatch_n_outputs:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	284 # if the input or target changes dimension on the fly, we resize and forget everything
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	285 self.forget()
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	286
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	287 def forget(self):
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	288 if self._n_inputs and self._n_outputs:
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	289 self.XtX.resize((1+self.n_inputs,1+self.n_inputs))
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	290 self.XtY.resize((1+self.n_inputs,self.n_outputs))
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	291 self.XtX.data[:,:]=0
88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	292 self.XtY.data[:,:]=0
118 d0a1bd0378c6 Finished draft of OneHiddenLayerNNetClassifier to debut learner.py Yoshua Bengio <bengioy@iro.umontreal.ca> parents: 111 diff changeset	293 numpy.diag(self.XtX.data)[1:]=self.L2_regularizer
111 88257dfedf8c Added another work in progress, for mlp's bengioy@bengiomac.local parents: diff changeset	294

Mercurial > pylearn

annotate mlp.py @ 179:9911d2cc3c01