Fri, 05 Mar 2010 18:07:20 -0500 |
fsavard |
Completely rewrote my series module, now based on HDF5 and PyTables (in a separate directory called 'tables_series' for retrocompatibility of running code). Minor (inconsequential) changes to stacked_dae.
|
Thu, 04 Mar 2010 20:43:21 -0500 |
Arnaud Bergeron |
Merge branches from main repo.
|
Thu, 04 Mar 2010 09:43:23 -0500 |
youssouf |
removed one bug: the complexity value was not sent to the dA class
|
Thu, 04 Mar 2010 08:21:43 -0500 |
fsavard |
Merge
|
Thu, 04 Mar 2010 08:18:42 -0500 |
fsavard |
Changé le coût de reconstruction pour stabilité numérique, en ajoutant une petite constante dans le log.
|
Thu, 04 Mar 2010 00:54:12 -0500 |
boulanni |
Actual script used to launch images generation on 4 machines
|
Wed, 03 Mar 2010 16:52:10 -0500 |
Arnaud Bergeron |
Branch merge.
|
Wed, 03 Mar 2010 16:46:16 -0500 |
Arnaud Bergeron |
Branch merge
|
Tue, 02 Mar 2010 20:16:30 -0500 |
Arnaud Bergeron |
Adapt the sdae code for ift6266.datasets input.
|
Tue, 02 Mar 2010 18:43:54 -0500 |
Arnaud Bergeron |
Add MSE cost to log_reg.py
|
Tue, 02 Mar 2010 18:16:49 -0500 |
Arnaud Bergeron |
Modify the log_reg.py tutorial code to use the datasets module.
|
Tue, 02 Mar 2010 18:03:42 -0500 |
Arnaud Bergeron |
Add __init__.py files to the remaining directories that miss them.
|
Tue, 02 Mar 2010 18:03:09 -0500 |
Arnaud Bergeron |
Fix import errors (conv and downsample are no longer in sandbox).
|
Tue, 02 Mar 2010 18:01:22 -0500 |
Arnaud Bergeron |
Add option for test.py to test modules specified on the command-line.
|
Tue, 02 Mar 2010 17:28:14 -0500 |
Arnaud Bergeron |
Fix import of scalar_series.
|
Tue, 02 Mar 2010 17:00:59 -0500 |
Arnaud Bergeron |
Add option to test a module given on the command line.
|
Wed, 03 Mar 2010 12:51:40 -0500 |
fsavard |
Commented a few things, renamed the produit_croise_jobs function, replaced the cost function (NOT TESTED YET).
|
Tue, 02 Mar 2010 14:47:18 -0500 |
fsavard |
Ajouts mineurs à stacked_dae, juste printé l'heure je crois.
|
Tue, 02 Mar 2010 09:52:27 -0500 |
youssouf |
initial commit for autoencoder training
|
Mon, 01 Mar 2010 17:06:49 -0500 |
Arnaud Bergeron |
Fix bug where there would be a bunch of 0-length batches at the end under certain circumstances.
|
Mon, 01 Mar 2010 11:46:39 -0500 |
fsavard |
Ajouté __init__.py pour utils
|
Mon, 01 Mar 2010 11:45:59 -0500 |
fsavard |
Merge
|
Mon, 01 Mar 2010 11:45:25 -0500 |
fsavard |
Ajout du code de base pour scalar_series. Modifications à stacked_dae: réglé un problème avec les input_divider (empêchait une optimisation), et ajouté utilisation des séries. Si j'avais pas déjà commité, aussi, j'ai enlevé l'histoire de réutilisation du pretraining: c'était compliqué (error prone) et ça créait des jobs beaucoup trop longues.
|
Fri, 26 Feb 2010 17:45:52 -0500 |
fsavard |
Enlevé ce qui concernait la réutilisation de résultats de préentraînement (trop compliqué pour peu de bénéfice: c'est le finetuning qui est vraiment long
|
Sat, 27 Feb 2010 19:26:26 -0500 |
boulanni |
Transient exception handling in captchas (ie. lorsque le NFS est temporairement inaccessible)
|
Sat, 27 Feb 2010 19:21:57 -0500 |
boulanni |
Adapted pipeline to new directory structure
|
Sat, 27 Feb 2010 18:28:48 -0500 |
boulanni |
J'ai reséparé NIST/OCR purs pour avoir des ensembles de test et de validation de 80000 plutôt que 20000, comme on a discuté au cours
|
Sat, 27 Feb 2010 17:10:37 -0500 |
Arnaud Bergeron |
Remove a stray cast in the FTDataSet code and export the ocr dataset.
|
Sat, 27 Feb 2010 16:50:16 -0500 |
Arnaud Bergeron |
Add dtype conversion and rescaling to the read path.
|
Sat, 27 Feb 2010 16:07:09 -0500 |
Arnaud Bergeron |
Do not yield theano shared variables. They can only be used by theano.function().
|
Sat, 27 Feb 2010 15:09:02 -0500 |
Arnaud Bergeron |
Make the datasets iterators return theano shared slices with the appropriate types.
|
Sat, 27 Feb 2010 14:15:11 -0500 |
Arnaud Bergeron |
Use izip(), not zip() to return a lazy iterator. (datasets)
|
Sat, 27 Feb 2010 14:10:14 -0500 |
Arnaud Bergeron |
Update comments in the dataset definition (you can't pass 0 as minibatch size).
|
Sat, 27 Feb 2010 13:56:14 -0500 |
Arnaud Bergeron |
Define the ocr dataset and use the existing split for nist.
|
Sat, 27 Feb 2010 12:18:26 -0500 |
Arnaud Bergeron |
Make data_generation.transformations importable and fixup test.py to not try some of the modules.
|
Sat, 27 Feb 2010 12:01:08 -0500 |
Arnaud Bergeron |
Take the validation set at the end of the training set files rather than at the beginning.
|
Fri, 26 Feb 2010 15:25:44 -0500 |
Dumitru Erhan |
ignoring certain files when doing hg status
|
Fri, 26 Feb 2010 15:25:01 -0500 |
Dumitru Erhan |
making the data_generation folder (and subdirs) an importable module
|
Fri, 26 Feb 2010 14:28:48 -0500 |
Dumitru Erhan |
moved deepmlp code into baseline/deep_mlp
|
Fri, 26 Feb 2010 14:24:11 -0500 |
Dumitru Erhan |
directory name change
|
Fri, 26 Feb 2010 14:23:47 -0500 |
Dumitru Erhan |
Pipeline code shuffle
|
Fri, 26 Feb 2010 14:15:38 -0500 |
Dumitru Erhan |
More moves - transformations into data_generation, added "deep" folder
|
Fri, 26 Feb 2010 14:03:24 -0500 |
Dumitru Erhan |
Moving the convolutional MLP code into baseline
|
Fri, 26 Feb 2010 13:55:27 -0500 |
Dumitru Erhan |
Updating the tutorial code to the latest revisions.
|
Thu, 25 Feb 2010 18:53:02 -0500 |
Arnaud Bergeron |
Add nist_lower, nist_upper, nist_all
|
Thu, 25 Feb 2010 18:40:01 -0500 |
Arnaud Bergeron |
Add inital implementation of datasets.
|
Thu, 25 Feb 2010 18:12:18 -0500 |
Arnaud Bergeron |
Do not commit syntax errors. (in test.py)
|
Thu, 25 Feb 2010 18:11:25 -0500 |
Arnaud Bergeron |
Make test not test itself.
|
Thu, 25 Feb 2010 17:27:49 -0500 |
Arnaud Bergeron |
Simple script to doctest all modules beneath ift6266.
|
Thu, 25 Feb 2010 09:05:48 -0500 |
Myriam Cote |
merge
|
Thu, 25 Feb 2010 09:04:40 -0500 |
Myriam Cote |
nouveau répertoire régression logistique
|
Wed, 24 Feb 2010 19:27:38 -0500 |
boulanni |
Ajouté seed 100 à 207 aux ensembles de données générés
|
Wed, 24 Feb 2010 19:12:01 -0500 |
boulanni |
On peut maintenant launcher le pipeline avec un seed donné, résultats déterministes
|
Wed, 24 Feb 2010 18:27:09 -0500 |
boulanni |
Enlevé les re-seed constants, interfère avec les autres modules
|
Wed, 24 Feb 2010 16:59:04 -0500 |
boulanni |
Checked all modules to work with only numpy.random and random and to be deterministic after numpy.random.seed() and random.seed()
|
Wed, 24 Feb 2010 13:51:18 -0500 |
SylvainPL |
Script utilise pour creer le jeu de donnees utilise pour le module Occlusion.py. De plus, le fichier /data/lisa/data/ift6266h10/echantillon_occlusion.py a change afin d'etre cree avec seed random (jeu reproductible)
|
Wed, 24 Feb 2010 13:16:14 -0500 |
SylvainPL |
Rajout d'un seed random et d'une fonction get_seed
|
Wed, 24 Feb 2010 13:15:52 -0500 |
SylvainPL |
Rajout d'un seed random et d'une fonction get_seed
|
Wed, 24 Feb 2010 13:15:28 -0500 |
SylvainPL |
Rajout d'un seed random et d'une fonction get_seed
|
Wed, 24 Feb 2010 13:14:55 -0500 |
SylvainPL |
Rajout d'un seed random et d'une fonction get_seed.Aussi, import random enleve car non necessaire
|
Wed, 24 Feb 2010 13:14:02 -0500 |
SylvainPL |
Rajout d'un seed random et d'une fonction get_seed
|
Wed, 24 Feb 2010 13:13:33 -0500 |
SylvainPL |
Rajout d'un seed random et d'une fonction get_seed
|
Wed, 24 Feb 2010 12:44:39 -0500 |
Jeremy Eustache |
Reseau a convolution
|
Tue, 23 Feb 2010 18:23:47 -0500 |
XavierMuller |
changed adaptive lr flag from bool to int for jobman issues
|
Tue, 23 Feb 2010 18:16:55 -0500 |
XavierMuller |
merge
|
Tue, 23 Feb 2010 18:08:11 -0500 |
XavierMuller |
added adaptive lr, weight file save, traine error and error curves
|
Tue, 23 Feb 2010 14:15:47 -0500 |
boulanni |
Added other auxiliary files corruption tests
|
Mon, 22 Feb 2010 14:22:07 -0500 |
fsavard |
Changé un True pour False, mais je le commit car c'est ça que j'utilise pour lancer mes jobs.
|
Mon, 22 Feb 2010 13:39:35 -0500 |
fsavard |
Ajoutés fichiers oubliés pour previous commit.
|
Mon, 22 Feb 2010 13:38:25 -0500 |
fsavard |
Ajouté des __init__.py dans l'arborescence pour que les scripts puissent être utilisés avec des paths pour jobman, et fait pas mal de modifs dans stacked_dae pour pouvoir réutiliser le travail fait pour des tests où le pretraining est le même.
|
Sun, 21 Feb 2010 17:30:38 -0600 |
Owner |
Initial commit for the stacked convolutional denoising autoencoders
|
Sat, 20 Feb 2010 02:12:57 -0500 |
boulanni |
Added script to separate OCR data in train, validation and test sets (raw data)
|
Sat, 20 Feb 2010 02:11:56 -0500 |
boulanni |
Added script to launch the ~108 data generation jobs with dbidispatch
|
Sat, 20 Feb 2010 02:10:30 -0500 |
boulanni |
Added script to test truetype font files validity (corruption)
|
Sat, 20 Feb 2010 02:09:09 -0500 |
boulanni |
Fixed various bugs in pipeline for Python 2.5 support
|
Sat, 20 Feb 2010 02:07:29 -0500 |
boulanni |
Adapted ttf2jpg to get fonts in /Tmp/allfonts local folder
|
Sat, 20 Feb 2010 02:06:38 -0500 |
boulanni |
Adapted pycaptcha to get fonts in /Tmp/allfonts local folder
|
Fri, 19 Feb 2010 08:43:10 -0500 |
savardf |
Un peu de ménage dans code pour stacked DAE, splitté en fichiers dans un nouveau sous-répertoire.
|
Thu, 18 Feb 2010 14:44:23 -0500 |
Xavier Glorot |
merge
|
Thu, 18 Feb 2010 14:43:53 -0500 |
Xavier Glorot |
Changes to fit with visualisation
|
Thu, 18 Feb 2010 14:27:49 -0500 |
boulanni |
Added captcha support in pipeline.py
|
Thu, 18 Feb 2010 14:16:54 -0500 |
boulanni |
Added digits and uppercase letters to list of possible characters in captchas
|
Thu, 18 Feb 2010 14:15:47 -0500 |
boulanni |
Fixed bug in pycaptcha/Facade.py
|
Thu, 18 Feb 2010 12:58:34 -0500 |
Xavier Glorot |
little changes in Rature and occlusion to fit with visualisation
|
Thu, 18 Feb 2010 12:33:17 -0500 |
Xavier Glorot |
reduced affine transform coefficient
|
Thu, 18 Feb 2010 11:10:53 -0500 |
SylvainPL |
Maintenant, plus grande probablite d'effectuer une occlusion. Proba= 0.3 maintenant
|
Thu, 18 Feb 2010 10:55:29 -0500 |
SylvainPL |
Correction d'un petit bug (random.randint a des bornes inclusives, ce qui pouvait creer un petit bug)
|
Thu, 18 Feb 2010 10:53:36 -0500 |
SylvainPL |
Maintenant, les ratures sont fabriquees a partir de 1 qui ont ete transformes pas mal. Les ratures peuvent maintenant etre plus d'une. Proba 0.15 d'effectuer une rature
|
Wed, 17 Feb 2010 17:45:48 -0500 |
Xavier Glorot |
changed some transformation paramters to better fit with visualization
|
Wed, 17 Feb 2010 17:06:54 -0500 |
fsavard |
Refait stacked_dae.py en utilisant le dataset complet shared (juste reparti à 0 à partir du code du tutoriel), et préparé pour utiliser NIST (pas testé)
|
Wed, 17 Feb 2010 16:25:44 -0500 |
Xavier Glorot |
small change to testtransformation to match with the pipeline behavior
|
Wed, 17 Feb 2010 16:23:54 -0500 |
Xavier Glorot |
changed again the variance scaling for Distorsion Gauss, come back to the original
|
Wed, 17 Feb 2010 16:22:54 -0500 |
Xavier Glorot |
changes on pipeline mecanism: we now sample a different complexity for each transformations, this because when we use the same sampled complexity for all the modules 1/8 of the time we are close to 0 and we obtain an image very close to the source, we now save a complexity for each module in the parameters array
|
Wed, 17 Feb 2010 16:20:15 -0500 |
Xavier Glorot |
changes on pipeline mecanism: we now sample a different complexity for each transformations, this because when we use the same sampled complexity for all the modules 1/8 of the time we are close to 0 and we obtain an image very close to the source, we now save a complexity for each module in the parameters array
|
Wed, 17 Feb 2010 09:29:19 -0500 |
fsavard |
Added stacked DAE code for my experiments, based on tutorial code. Quite unfinished.
|
Tue, 16 Feb 2010 18:56:22 -0500 |
Xavier Glorot |
testtransformation.py to source from all the available data
|
Tue, 16 Feb 2010 18:55:51 -0500 |
Xavier Glorot |
Changed the variance factor of the distorsion gauss from /10 to /15 (to have a bit less noise)
|
Tue, 16 Feb 2010 17:24:21 -0500 |
Xavier Glorot |
Changed a bit the code for BruitGauss.py for simplicity
|
Tue, 16 Feb 2010 17:12:35 -0500 |
XavierMuller |
added simple mlp file
|
Tue, 16 Feb 2010 13:10:06 -0500 |
boulanni |
Adapté le générateur d'images de fontes pour utiliser en amont du pipeline
|
Mon, 15 Feb 2010 16:17:48 -0500 |
boulanni |
pipeline.py: placé les modules dans le bon ordre + store NIST en bytes plutôt qu'en float32 dans la RAM
|
Mon, 15 Feb 2010 15:35:17 -0500 |
boulanni |
Ajouté un script pour visualiser les ensembles de données générés enregistrés dans le format filetensor (nist_read2.py)
|
Mon, 15 Feb 2010 15:22:08 -0500 |
boulanni |
Correction bug division par zéro dans BruitGauss.py
|
Fri, 12 Feb 2010 10:30:02 -0500 |
SylvainPL |
Parametre deterministe retourne dans les fonctions '_determined_by_complexity' et le parametre stochastique retourne dans les fonctions conventionnelles
|
Fri, 12 Feb 2010 10:21:21 -0500 |
SylvainPL |
corrige nom de la methode get_settings_names_determined_by_complexity(self,complexity)
|
Fri, 12 Feb 2010 10:21:02 -0500 |
SylvainPL |
corrige nom de la methode get_settings_names_determined_by_complexity(self,complexity)
|
Fri, 12 Feb 2010 10:15:22 -0500 |
SylvainPL |
Parametre stochastique retourne par fonctions habituelles et le parametre deterministe retourne par fonctions 'determined_by_complexity'
|
Fri, 12 Feb 2010 10:13:50 -0500 |
SylvainPL |
Valeur d'entree des methodes 'determines_by_complexity' harmonisees avec local_elastic_distortion.py
|
Fri, 12 Feb 2010 09:53:40 -0500 |
SylvainPL |
Separation des parametres deterministes et stochastiques dans les methodes retournant noms et valeurs
|
Thu, 11 Feb 2010 17:26:44 -0500 |
Xavier Glorot |
deleted useless print in BruitGauss.py
|
Thu, 11 Feb 2010 16:36:30 -0500 |
Xavier Glorot |
merge
|
Thu, 11 Feb 2010 16:36:12 -0500 |
Xavier Glorot |
Changed order of transformation
|
Thu, 11 Feb 2010 16:34:25 -0500 |
Xavier Glorot |
Changed behavior of gaussian noise to apply a gauss filter with a random sigma, and then select some point of the image to be averaged with it
|
Thu, 11 Feb 2010 12:18:34 -0500 |
SylvainPL |
Rajout du calcul de la proportion de lettres (min+maj)
|
Thu, 11 Feb 2010 11:55:03 -0500 |
Xavier Glorot |
cleaning some *.pyc and *.py~ files in pycapcha
|
Thu, 11 Feb 2010 11:23:35 -0500 |
SylvainPL |
Ajout d'un graphique (histogramme) comparatif pour l'occurence de chaque caractere
|
Thu, 11 Feb 2010 10:43:22 -0500 |
SylvainPL |
Petit script primitif utilise pour calculer la proportion des trois classes dans Nist train et test.
|
Thu, 11 Feb 2010 09:15:42 -0500 |
SylvainPL |
Il y a maintenant une proba 0.2 d'effectuer des permutations. Cette nouvelle fonctionnalite demande un parametre non deterministe, ce qui fait que maintenant, les fonctions 'determined_by_complexity' ont ete abandonees. Le module se comporte comme un module normal
|
Thu, 11 Feb 2010 09:08:16 -0500 |
SylvainPL |
Il y a maintenant une proba de 0.3 d'effectuer le bruitage. De plus, comme cette nouvelle fonctionnalite demande un parametre non-deterministe, les deux fonctions 'determined_by_complexity' ont ete enlevees. Le module se comporte comme un module conventionnel
|
Thu, 11 Feb 2010 09:01:03 -0500 |
SylvainPL |
Il y a maintenant 25% de proba d'effectuer le bruitage
|