ift6266: deep/stacked_dae/sgd_optimization.py comparison

comparison deep/stacked_dae/sgd_optimization.py @ 284:8a3af19ae272

Enlevé mécanique pour limiter le nombre d'exemples utilisés (remplacé par paramètre dans l'appel au code de dataset), et ajouté option pour sauvegarde des poids à la fin de l'entraînement

author	fsavard
date	Wed, 24 Mar 2010 15:13:48 -0400
parents	7b4507295eba
children

comparison

equal deleted inserted replaced

-:206374eed2fb
+:8a3af19ae272
 #!/usr/bin/python
 # coding: utf-8
 # Generic SdA optimization loop, adapted from the deeplearning.net tutorial
+from __future__ import with_statement
 import numpy
 import theano
 import time
 import datetime
 'validation_error' : DummySeries(),
 'test_error' : DummySeries(),
 'params' : DummySeries()
 }
-def itermax(iter, max):
-for i,it in enumerate(iter):
-if i >= max:
-break
-yield it
 class SdaSgdOptimizer:
 def __init__(self, dataset, hyperparameters, n_ins, n_outs,
-examples_per_epoch, series=default_series, max_minibatches=None):
+examples_per_epoch, series=default_series,
+save_params=False):
 self.dataset = dataset
 self.hp = hyperparameters
 self.n_ins = n_ins
 self.n_outs = n_outs
-self.max_minibatches = max_minibatches
+self.save_params = save_params
-print "SdaSgdOptimizer, max_minibatches =", max_minibatches
 self.ex_per_epoch = examples_per_epoch
 self.mb_per_epoch = examples_per_epoch / self.hp.minibatch_size
 self.series = series
 batch_index+=1
 #if batch_index % 100 == 0:
 #    print "100 batches"
-# useful when doing tests
-if self.max_minibatches and batch_index >= self.max_minibatches:
-break
 print 'Pre-training layer %i, epoch %d, cost '%(i,epoch),c
 sys.stdout.flush()
 self.series['params'].append((epoch,), self.classifier.all_params)
 validation_frequency  = min(self.mb_per_epoch, patience/2)
 # go through this many
 # minibatche before checking the network
 # on the validation set; in this case we
 # check every epoch
-if self.max_minibatches and validation_frequency > self.max_minibatches:
-validation_frequency = self.max_minibatches / 2
 best_params          = None
 best_validation_loss = float('inf')
 test_score           = 0.
 start_time = time.clock()
 self.series["training_error"].append((epoch, minibatch_index), cost_ij)
 if (total_mb_index+1) % validation_frequency == 0:
 iter = dataset.valid(minibatch_size)
-if self.max_minibatches:
-iter = itermax(iter, self.max_minibatches)
 validation_losses = [validate_model(x,y) for x,y in iter]
 this_validation_loss = numpy.mean(validation_losses)
 self.series["validation_error"].\
 append((epoch, minibatch_index), this_validation_loss*100.)
 best_validation_loss = this_validation_loss
 best_iter = total_mb_index
 # test it on the test set
 iter = dataset.test(minibatch_size)
-if self.max_minibatches:
-iter = itermax(iter, self.max_minibatches)
 test_losses = [test_model(x,y) for x,y in iter]
 test_score = numpy.mean(test_losses)
 self.series["test_error"].\
 append((epoch, minibatch_index), test_score*100.)
 'model %f %%') %
 (epoch, minibatch_index+1, self.mb_per_epoch,
 test_score*100.))
 sys.stdout.flush()
-# useful when doing tests
-if self.max_minibatches and minibatch_index >= self.max_minibatches:
-break
 self.series['params'].append((epoch,), self.classifier.all_params)
 if patience <= total_mb_index:
 done_looping = True
 self.hp.update({'finetuning_time':end_time-start_time,\
 'best_validation_error':best_validation_loss,\
 'test_score':test_score,
 'num_finetuning_epochs':epoch})
+if self.save_params:
+save_params(self.classifier.all_params, "weights.dat")
 print(('Optimization complete with best validation score of %f %%,'
 'with test performance %f %%') %
 (best_validation_loss * 100., test_score*100.))
 print ('The finetuning ran for %f minutes' % ((end_time-start_time)/60.))
+def save_params(all_params, filename):
+import pickle
+with open(filename, 'wb') as f:
+values = [p.value for p in all_params]
+# -1 for HIGHEST_PROTOCOL
+pickle.dump(values, f, -1)

Mercurial > ift6266

comparison deep/stacked_dae/sgd_optimization.py @ 284:8a3af19ae272