ift6266: deep/stacked_dae/mnist

annotate deep/stacked_dae/mnist_sda.py @ 239:42005ec87747

Mergé (manuellement) les changements de Sylvain pour utiliser le code de dataset d'Arnaud, à cette différence près que je n'utilse pas les givens. J'ai probablement une approche différente pour limiter la taille du dataset dans mon débuggage, aussi.

author	fsavard
date	Mon, 15 Mar 2010 18:30:21 -0400
parents	3632e6258642
children

rev	line source
131 5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	1 #!/usr/bin/python
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	2 # coding: utf-8
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	3
191 3632e6258642 Ajouts mineurs à stacked_dae, juste printé l'heure je crois. fsavard parents: 167 diff changeset	4 # TODO: This probably doesn't work anymore, adapt to new code in sgd_opt
131 5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	5 # Parameterize call to sgd_optimization for MNIST
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	6
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	7 import numpy
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	8 import theano
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	9 import time
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	10 import theano.tensor as T
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	11 from theano.tensor.shared_randomstreams import RandomStreams
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	12
139 7d8366fb90bf Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même. fsavard parents: 131 diff changeset	13 from sgd_optimization import SdaSgdOptimizer
131 5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	14 import cPickle, gzip
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	15 from jobman import DD
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	16
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	17 MNIST_LOCATION = '/u/savardf/datasets/mnist.pkl.gz'
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	18
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	19 def sgd_optimization_mnist(learning_rate=0.1, pretraining_epochs = 2, \
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	20 pretrain_lr = 0.1, training_epochs = 5, \
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	21 dataset='mnist.pkl.gz'):
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	22 # Load the dataset
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	23 f = gzip.open(dataset,'rb')
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	24 # this gives us train, valid, test (each with .x, .y)
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	25 dataset = cPickle.load(f)
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	26 f.close()
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	27
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	28 n_ins = 28*28
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	29 n_outs = 10
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	30
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	31 hyperparameters = DD({'finetuning_lr':learning_rate,
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	32 'pretraining_lr':pretrain_lr,
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	33 'pretraining_epochs_per_layer':pretraining_epochs,
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	34 'max_finetuning_epochs':training_epochs,
139 7d8366fb90bf Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même. fsavard parents: 131 diff changeset	35 'hidden_layers_sizes':[100],
7d8366fb90bf Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même. fsavard parents: 131 diff changeset	36 'corruption_levels':[0.2],
131 5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	37 'minibatch_size':20})
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	38
139 7d8366fb90bf Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même. fsavard parents: 131 diff changeset	39 optimizer = SdaSgdOptimizer(dataset, hyperparameters, n_ins, n_outs)
7d8366fb90bf Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même. fsavard parents: 131 diff changeset	40 optimizer.pretrain()
7d8366fb90bf Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même. fsavard parents: 131 diff changeset	41 optimizer.finetune()
131 5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	42
5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	43 if __name__ == '__main__':
139 7d8366fb90bf Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même. fsavard parents: 131 diff changeset	44 sgd_optimization_mnist(dataset=MNIST_LOCATION)
131 5c79a2557f2f Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire. savardf parents: diff changeset	45

Mercurial > ift6266

annotate deep/stacked_dae/mnist_sda.py @ 239:42005ec87747