Mon, 01 Mar 2010 17:06:49 -0500 |
Arnaud Bergeron |
Fix bug where there would be a bunch of 0-length batches at the end under certain circumstances.
|
Mon, 01 Mar 2010 11:46:39 -0500 |
fsavard |
Ajouté __init__.py pour utils
|
Mon, 01 Mar 2010 11:45:59 -0500 |
fsavard |
Merge
|
Mon, 01 Mar 2010 11:45:25 -0500 |
fsavard |
Ajout du code de base pour scalar_series. Modifications à stacked_dae: réglé un problème avec les input_divider (empêchait une optimisation), et ajouté utilisation des séries. Si j'avais pas déjà commité, aussi, j'ai enlevé l'histoire de réutilisation du pretraining: c'était compliqué (error prone) et ça créait des jobs beaucoup trop longues.
|
Fri, 26 Feb 2010 17:45:52 -0500 |
fsavard |
Enlevé ce qui concernait la réutilisation de résultats de préentraînement (trop compliqué pour peu de bénéfice: c'est le finetuning qui est vraiment long
|
Sat, 27 Feb 2010 19:26:26 -0500 |
boulanni |
Transient exception handling in captchas (ie. lorsque le NFS est temporairement inaccessible)
|
Sat, 27 Feb 2010 19:21:57 -0500 |
boulanni |
Adapted pipeline to new directory structure
|
Sat, 27 Feb 2010 18:28:48 -0500 |
boulanni |
J'ai reséparé NIST/OCR purs pour avoir des ensembles de test et de validation de 80000 plutôt que 20000, comme on a discuté au cours
|
Sat, 27 Feb 2010 17:10:37 -0500 |
Arnaud Bergeron |
Remove a stray cast in the FTDataSet code and export the ocr dataset.
|
Sat, 27 Feb 2010 16:50:16 -0500 |
Arnaud Bergeron |
Add dtype conversion and rescaling to the read path.
|
Sat, 27 Feb 2010 16:07:09 -0500 |
Arnaud Bergeron |
Do not yield theano shared variables. They can only be used by theano.function().
|
Sat, 27 Feb 2010 15:09:02 -0500 |
Arnaud Bergeron |
Make the datasets iterators return theano shared slices with the appropriate types.
|
Sat, 27 Feb 2010 14:15:11 -0500 |
Arnaud Bergeron |
Use izip(), not zip() to return a lazy iterator. (datasets)
|
Sat, 27 Feb 2010 14:10:14 -0500 |
Arnaud Bergeron |
Update comments in the dataset definition (you can't pass 0 as minibatch size).
|
Sat, 27 Feb 2010 13:56:14 -0500 |
Arnaud Bergeron |
Define the ocr dataset and use the existing split for nist.
|
Sat, 27 Feb 2010 12:18:26 -0500 |
Arnaud Bergeron |
Make data_generation.transformations importable and fixup test.py to not try some of the modules.
|
Sat, 27 Feb 2010 12:01:08 -0500 |
Arnaud Bergeron |
Take the validation set at the end of the training set files rather than at the beginning.
|
Fri, 26 Feb 2010 15:25:44 -0500 |
Dumitru Erhan |
ignoring certain files when doing hg status
|
Fri, 26 Feb 2010 15:25:01 -0500 |
Dumitru Erhan |
making the data_generation folder (and subdirs) an importable module
|
Fri, 26 Feb 2010 14:28:48 -0500 |
Dumitru Erhan |
moved deepmlp code into baseline/deep_mlp
|
Fri, 26 Feb 2010 14:24:11 -0500 |
Dumitru Erhan |
directory name change
|
Fri, 26 Feb 2010 14:23:47 -0500 |
Dumitru Erhan |
Pipeline code shuffle
|
Fri, 26 Feb 2010 14:15:38 -0500 |
Dumitru Erhan |
More moves - transformations into data_generation, added "deep" folder
|
Fri, 26 Feb 2010 14:03:24 -0500 |
Dumitru Erhan |
Moving the convolutional MLP code into baseline
|