
age author description
Wed, 03 Mar 2010 16:52:10 -0500 Arnaud Bergeron Branch merge.
Wed, 03 Mar 2010 16:46:16 -0500 Arnaud Bergeron Branch merge
Tue, 02 Mar 2010 20:16:30 -0500 Arnaud Bergeron Adapt the sdae code for ift6266.datasets input.
Tue, 02 Mar 2010 18:43:54 -0500 Arnaud Bergeron Add MSE cost to log_reg.py
Tue, 02 Mar 2010 18:16:49 -0500 Arnaud Bergeron Modify the log_reg.py tutorial code to use the datasets module.
Tue, 02 Mar 2010 18:03:42 -0500 Arnaud Bergeron Add __init__.py files to the remaining directories that miss them.
Tue, 02 Mar 2010 18:03:09 -0500 Arnaud Bergeron Fix import errors (conv and downsample are no longer in sandbox).
Tue, 02 Mar 2010 18:01:22 -0500 Arnaud Bergeron Add option for test.py to test modules specified on the command-line.
Tue, 02 Mar 2010 17:28:14 -0500 Arnaud Bergeron Fix import of scalar_series.
Tue, 02 Mar 2010 17:00:59 -0500 Arnaud Bergeron Add option to test a module given on the command line.
Wed, 03 Mar 2010 12:51:40 -0500 fsavard Commented a few things, renamed the produit_croise_jobs function, replaced the cost function (NOT TESTED YET).
Tue, 02 Mar 2010 14:47:18 -0500 fsavard Ajouts mineurs à stacked_dae, juste printé l'heure je crois.
Tue, 02 Mar 2010 09:52:27 -0500 youssouf initial commit for autoencoder training
Mon, 01 Mar 2010 17:06:49 -0500 Arnaud Bergeron Fix bug where there would be a bunch of 0-length batches at the end under certain circumstances.
Mon, 01 Mar 2010 11:46:39 -0500 fsavard Ajouté __init__.py pour utils
Mon, 01 Mar 2010 11:45:59 -0500 fsavard Merge
Mon, 01 Mar 2010 11:45:25 -0500 fsavard Ajout du code de base pour scalar_series. Modifications à stacked_dae: réglé un problème avec les input_divider (empêchait une optimisation), et ajouté utilisation des séries. Si j'avais pas déjà commité, aussi, j'ai enlevé l'histoire de réutilisation du pretraining: c'était compliqué (error prone) et ça créait des jobs beaucoup trop longues.
Fri, 26 Feb 2010 17:45:52 -0500 fsavard Enlevé ce qui concernait la réutilisation de résultats de préentraînement (trop compliqué pour peu de bénéfice: c'est le finetuning qui est vraiment long
Sat, 27 Feb 2010 19:26:26 -0500 boulanni Transient exception handling in captchas (ie. lorsque le NFS est temporairement inaccessible)
Sat, 27 Feb 2010 19:21:57 -0500 boulanni Adapted pipeline to new directory structure
Sat, 27 Feb 2010 18:28:48 -0500 boulanni J'ai reséparé NIST/OCR purs pour avoir des ensembles de test et de validation de 80000 plutôt que 20000, comme on a discuté au cours
Sat, 27 Feb 2010 17:10:37 -0500 Arnaud Bergeron Remove a stray cast in the FTDataSet code and export the ocr dataset.
Sat, 27 Feb 2010 16:50:16 -0500 Arnaud Bergeron Add dtype conversion and rescaling to the read path.
Sat, 27 Feb 2010 16:07:09 -0500 Arnaud Bergeron Do not yield theano shared variables. They can only be used by theano.function().
Sat, 27 Feb 2010 15:09:02 -0500 Arnaud Bergeron Make the datasets iterators return theano shared slices with the appropriate types.
Sat, 27 Feb 2010 14:15:11 -0500 Arnaud Bergeron Use izip(), not zip() to return a lazy iterator. (datasets)
Sat, 27 Feb 2010 14:10:14 -0500 Arnaud Bergeron Update comments in the dataset definition (you can't pass 0 as minibatch size).
Sat, 27 Feb 2010 13:56:14 -0500 Arnaud Bergeron Define the ocr dataset and use the existing split for nist.
Sat, 27 Feb 2010 12:18:26 -0500 Arnaud Bergeron Make data_generation.transformations importable and fixup test.py to not try some of the modules.
Sat, 27 Feb 2010 12:01:08 -0500 Arnaud Bergeron Take the validation set at the end of the training set files rather than at the beginning.
Fri, 26 Feb 2010 15:25:44 -0500 Dumitru Erhan ignoring certain files when doing hg status
Fri, 26 Feb 2010 15:25:01 -0500 Dumitru Erhan making the data_generation folder (and subdirs) an importable module
Fri, 26 Feb 2010 14:28:48 -0500 Dumitru Erhan moved deepmlp code into baseline/deep_mlp
Fri, 26 Feb 2010 14:24:11 -0500 Dumitru Erhan directory name change
Fri, 26 Feb 2010 14:23:47 -0500 Dumitru Erhan Pipeline code shuffle
Fri, 26 Feb 2010 14:15:38 -0500 Dumitru Erhan More moves - transformations into data_generation, added "deep" folder
Fri, 26 Feb 2010 14:03:24 -0500 Dumitru Erhan Moving the convolutional MLP code into baseline
Fri, 26 Feb 2010 13:55:27 -0500 Dumitru Erhan Updating the tutorial code to the latest revisions.
Thu, 25 Feb 2010 18:53:02 -0500 Arnaud Bergeron Add nist_lower, nist_upper, nist_all
Thu, 25 Feb 2010 18:40:01 -0500 Arnaud Bergeron Add inital implementation of datasets.
Thu, 25 Feb 2010 18:12:18 -0500 Arnaud Bergeron Do not commit syntax errors. (in test.py)
Thu, 25 Feb 2010 18:11:25 -0500 Arnaud Bergeron Make test not test itself.
Thu, 25 Feb 2010 17:27:49 -0500 Arnaud Bergeron Simple script to doctest all modules beneath ift6266.
Thu, 25 Feb 2010 09:05:48 -0500 Myriam Cote merge
Thu, 25 Feb 2010 09:04:40 -0500 Myriam Cote nouveau répertoire régression logistique
Wed, 24 Feb 2010 19:27:38 -0500 boulanni Ajouté seed 100 à 207 aux ensembles de données générés
Wed, 24 Feb 2010 19:12:01 -0500 boulanni On peut maintenant launcher le pipeline avec un seed donné, résultats déterministes
Wed, 24 Feb 2010 18:27:09 -0500 boulanni Enlevé les re-seed constants, interfère avec les autres modules
Wed, 24 Feb 2010 16:59:04 -0500 boulanni Checked all modules to work with only numpy.random and random and to be deterministic after numpy.random.seed() and random.seed()
Wed, 24 Feb 2010 13:51:18 -0500 SylvainPL Script utilise pour creer le jeu de donnees utilise pour le module Occlusion.py. De plus, le fichier /data/lisa/data/ift6266h10/echantillon_occlusion.py a change afin d'etre cree avec seed random (jeu reproductible)
Wed, 24 Feb 2010 13:16:14 -0500 SylvainPL Rajout d'un seed random et d'une fonction get_seed
Wed, 24 Feb 2010 13:15:52 -0500 SylvainPL Rajout d'un seed random et d'une fonction get_seed
Wed, 24 Feb 2010 13:15:28 -0500 SylvainPL Rajout d'un seed random et d'une fonction get_seed
Wed, 24 Feb 2010 13:14:55 -0500 SylvainPL Rajout d'un seed random et d'une fonction get_seed.Aussi, import random enleve car non necessaire
Wed, 24 Feb 2010 13:14:02 -0500 SylvainPL Rajout d'un seed random et d'une fonction get_seed
Wed, 24 Feb 2010 13:13:33 -0500 SylvainPL Rajout d'un seed random et d'une fonction get_seed
Wed, 24 Feb 2010 12:44:39 -0500 Jeremy Eustache Reseau a convolution
Tue, 23 Feb 2010 18:23:47 -0500 XavierMuller changed adaptive lr flag from bool to int for jobman issues
Tue, 23 Feb 2010 18:16:55 -0500 XavierMuller merge
Tue, 23 Feb 2010 18:08:11 -0500 XavierMuller added adaptive lr, weight file save, traine error and error curves
Tue, 23 Feb 2010 14:15:47 -0500 boulanni Added other auxiliary files corruption tests
Mon, 22 Feb 2010 14:22:07 -0500 fsavard Changé un True pour False, mais je le commit car c'est ça que j'utilise pour lancer mes jobs.
Mon, 22 Feb 2010 13:39:35 -0500 fsavard Ajoutés fichiers oubliés pour previous commit.
Mon, 22 Feb 2010 13:38:25 -0500 fsavard Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même.
Sun, 21 Feb 2010 17:30:38 -0600 Owner Initial commit for the stacked convolutional denoising autoencoders
Sat, 20 Feb 2010 02:12:57 -0500 boulanni Added script to separate OCR data in train, validation and test sets (raw data)
Sat, 20 Feb 2010 02:11:56 -0500 boulanni Added script to launch the ~108 data generation jobs with dbidispatch
Sat, 20 Feb 2010 02:10:30 -0500 boulanni Added script to test truetype font files validity (corruption)
Sat, 20 Feb 2010 02:09:09 -0500 boulanni Fixed various bugs in pipeline for Python 2.5 support
Sat, 20 Feb 2010 02:07:29 -0500 boulanni Adapted ttf2jpg to get fonts in /Tmp/allfonts local folder
Sat, 20 Feb 2010 02:06:38 -0500 boulanni Adapted pycaptcha to get fonts in /Tmp/allfonts local folder
Fri, 19 Feb 2010 08:43:10 -0500 savardf Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire.
Thu, 18 Feb 2010 14:44:23 -0500 Xavier Glorot merge
Thu, 18 Feb 2010 14:43:53 -0500 Xavier Glorot Changes to fit with visualisation
Thu, 18 Feb 2010 14:27:49 -0500 boulanni Added captcha support in pipeline.py
Thu, 18 Feb 2010 14:16:54 -0500 boulanni Added digits and uppercase letters to list of possible characters in captchas
Thu, 18 Feb 2010 14:15:47 -0500 boulanni Fixed bug in pycaptcha/Facade.py
Thu, 18 Feb 2010 12:58:34 -0500 Xavier Glorot little changes in Rature and occlusion to fit with visualisation
Thu, 18 Feb 2010 12:33:17 -0500 Xavier Glorot reduced affine transform coefficient
Thu, 18 Feb 2010 11:10:53 -0500 SylvainPL Maintenant, plus grande probablite d'effectuer une occlusion. Proba= 0.3 maintenant
Thu, 18 Feb 2010 10:55:29 -0500 SylvainPL Correction d'un petit bug (random.randint a des bornes inclusives, ce qui pouvait creer un petit bug)
Thu, 18 Feb 2010 10:53:36 -0500 SylvainPL Maintenant, les ratures sont fabriquees a partir de 1 qui ont ete transformes pas mal. Les ratures peuvent maintenant etre plus d'une. Proba 0.15 d'effectuer une rature
Wed, 17 Feb 2010 17:45:48 -0500 Xavier Glorot changed some transformation paramters to better fit with visualization
Wed, 17 Feb 2010 17:06:54 -0500 fsavard Refait stacked_dae.py en utilisant le dataset complet shared (juste reparti à 0 à partir du code du tutoriel), et préparé pour utiliser NIST (pas testé)
Wed, 17 Feb 2010 16:25:44 -0500 Xavier Glorot small change to testtransformation to match with the pipeline behavior
Wed, 17 Feb 2010 16:23:54 -0500 Xavier Glorot changed again the variance scaling for Distorsion Gauss, come back to the original
Wed, 17 Feb 2010 16:22:54 -0500 Xavier Glorot changes on pipeline mecanism: we now sample a different complexity for each transformations, this because when we use the same sampled complexity for all the modules 1/8 of the time we are close to 0 and we obtain an image very close to the source, we now save a complexity for each module in the parameters array
Wed, 17 Feb 2010 16:20:15 -0500 Xavier Glorot changes on pipeline mecanism: we now sample a different complexity for each transformations, this because when we use the same sampled complexity for all the modules 1/8 of the time we are close to 0 and we obtain an image very close to the source, we now save a complexity for each module in the parameters array
Wed, 17 Feb 2010 09:29:19 -0500 fsavard Added stacked DAE code for my experiments, based on tutorial code. Quite unfinished.
Tue, 16 Feb 2010 18:56:22 -0500 Xavier Glorot testtransformation.py to source from all the available data
Tue, 16 Feb 2010 18:55:51 -0500 Xavier Glorot Changed the variance factor of the distorsion gauss from /10 to /15 (to have a bit less noise)
Tue, 16 Feb 2010 17:24:21 -0500 Xavier Glorot Changed a bit the code for BruitGauss.py for simplicity
Tue, 16 Feb 2010 17:12:35 -0500 XavierMuller added simple mlp file
Tue, 16 Feb 2010 13:10:06 -0500 boulanni Adapté le générateur d'images de fontes pour utiliser en amont du pipeline
Mon, 15 Feb 2010 16:17:48 -0500 boulanni pipeline.py: placé les modules dans le bon ordre + store NIST en bytes plutôt qu'en float32 dans la RAM
Mon, 15 Feb 2010 15:35:17 -0500 boulanni Ajouté un script pour visualiser les ensembles de données générés enregistrés dans le format filetensor (nist_read2.py)