ift6266: deep/stacked_dae/v_sylvain/sgd_optimization.py comparison

comparison deep/stacked_dae/v_sylvain/sgd_optimization.py @ 233:02ed13244133

version pour utilisation du module dataset

author	SylvainPL <sylvain.pannetier.lebeuf@umontreal.ca>
date	Sun, 14 Mar 2010 15:07:17 -0400
parents	8a94a5c808cd
children	ecb69e17950b

comparison

equal deleted inserted replaced

-:4ce1fc11f4b2
+:02ed13244133
 #theano.printing.pydotprint(self.classifier.pretrain_functions[0], "function.graph")
 sys.stdout.flush()
 def train(self):
-self.pretrain()
+self.pretrain(self.dataset)
-self.finetune()
+self.finetune(self.dataset)
-def pretrain(self):
+def pretrain(self,dataset):
 print "STARTING PRETRAINING, time = ", datetime.datetime.now()
 sys.stdout.flush()
 start_time = time.clock()
 ## Pre-train layer-wise
 for i in xrange(self.classifier.n_layers):
 # go through pretraining epochs
 for epoch in xrange(self.hp.pretraining_epochs_per_layer):
 # go through the training set
-for batch_index in xrange(self.n_train_batches):
+for x,y in dataset.train(self.hp.minibatch_size):
-c = self.classifier.pretrain_functions[i](batch_index)
+c = self.classifier.pretrain_functions[i](x)
 self.series["reconstruction_error"].append((epoch, batch_index), c)
 print 'Pre-training layer %i, epoch %d, cost '%(i,epoch),c
 sys.stdout.flush()
 print ('Pretraining took %f minutes' %((end_time-start_time)/60.))
 self.hp.update({'pretraining_time': end_time-start_time})
 sys.stdout.flush()
-def finetune(self):
+def finetune(self,dataset):
 print "STARTING FINETUNING, time = ", datetime.datetime.now()
-index   = T.lscalar()    # index to a [mini]batch
+#index   = T.lscalar()    # index to a [mini]batch
 minibatch_size = self.hp.minibatch_size
 # create a function to compute the mistakes that are made by the model
 # on the validation set, or testing set
 shared_divider = theano.shared(numpy.asarray(self.input_divider, dtype=theano.config.floatX))
-test_model = theano.function([index], self.classifier.errors,
+test_model = theano.function([ensemble_x,ensemble_y], self.classifier.errors,
 givens = {
-self.classifier.x: self.test_set_x[index*minibatch_size:(index+1)*minibatch_size] / shared_divider,
+#self.classifier.x: self.test_set_x[index*minibatch_size:(index+1)*minibatch_size] / shared_divider,
-self.classifier.y: self.test_set_y[index*minibatch_size:(index+1)*minibatch_size]})
+#self.classifier.y: self.test_set_y[index*minibatch_size:(index+1)*minibatch_size]})
+self.classifier.x: ensemble_x,
-validate_model = theano.function([index], self.classifier.errors,
+self.classifier.y: ensemble_y})
+validate_model = theano.function([ensemble_x,ensemble_y], self.classifier.errors,
 givens = {
-self.classifier.x: self.valid_set_x[index*minibatch_size:(index+1)*minibatch_size] / shared_divider,
+#self.classifier.x: self.valid_set_x[index*minibatch_size:(index+1)*minibatch_size] / shared_divider,
-self.classifier.y: self.valid_set_y[index*minibatch_size:(index+1)*minibatch_size]})
+#self.classifier.y: self.valid_set_y[index*minibatch_size:(index+1)*minibatch_size]})
+self.classifier.x: ensemble_x,
+self.classifier.y: ensemble_y})
 # early-stopping parameters
 patience              = 10000 # look as this many examples regardless
 patience_increase     = 2.    # wait this much longer when a new best is
 done_looping = False
 epoch = 0
 while (epoch < self.hp.max_finetuning_epochs) and (not done_looping):
 epoch = epoch + 1
-for minibatch_index in xrange(self.n_train_batches):
+minibatch_index=int(-1)
+for x,y in dataset.train(minibatch_size):
-cost_ij = self.classifier.finetune(minibatch_index)
+minibatch_index+=1
+cost_ij = self.classifier.finetune(x,y)
 iter    = epoch * self.n_train_batches + minibatch_index
 self.series["training_error"].append((epoch, minibatch_index), cost_ij)
 if (iter+1) % validation_frequency == 0:
-validation_losses = [validate_model(i) for i in xrange(self.n_valid_batches)]
+validation_losses = [validate_model(x,y) for x,y in dataset.valid(minibatch_size)]
 this_validation_loss = numpy.mean(validation_losses)
 self.series["validation_error"].\
 append((epoch, minibatch_index), this_validation_loss*100.)
 # save best validation score and iteration number
 best_validation_loss = this_validation_loss
 best_iter = iter
 # test it on the test set
-test_losses = [test_model(i) for i in xrange(self.n_test_batches)]
+test_losses = [test_model(x,y) for x,y in dataset.test(minibatch_size)]
 test_score = numpy.mean(test_losses)
 self.series["test_error"].\
 append((epoch, minibatch_index), test_score*100.)

Mercurial > ift6266

comparison deep/stacked_dae/v_sylvain/sgd_optimization.py @ 233:02ed13244133