pylearn: pylearn/datasets/utlc.py comparison

comparison pylearn/datasets/utlc.py @ 1406:6003f733a994

added the normalization of the last UTLC dataset

author	Frederic Bastien <nouiz@nouiz.org>
date	Tue, 25 Jan 2011 04:16:33 -0500
parents	89017617ab36
children	2993b2a5c1af

comparison

equal deleted inserted replaced

-:89017617ab36
+:6003f733a994
 test = test.astype(theano.config.floatX)
 std = 0.69336046033925791#train.std()slow to compute
 train = (train) / std
 valid = (valid) / std
 test = (test) / std
-#elif name == "terry":
+elif name == "terry":
-#    import pdb;pdb.set_trace()
+train = train.astype(theano.config.floatX)
-#    train = train.astype(theano.config.floatX)
+valid = valid.astype(theano.config.floatX)
-#    valid = valid.astype(theano.config.floatX)
+test = test.astype(theano.config.floatX)
-#    test = test.astype(theano.config.floatX)
+train = (train) / 300
-#max = max(train.data.max(),0)
+valid = (valid) / 300
-#train = (train) / max
+test = (test) / 300
-#valid = (valid) / max
-#test = (test) / max
 else:
 raise Exception("This dataset don't have its normalization defined")
 return train, valid, test
 def load_filetensor(fname):
 assert isinstance(train, numpy.ndarray)
 assert isinstance(valid, numpy.ndarray)
 assert isinstance(test, numpy.ndarray)
 assert train.shape[1]==test.shape[1]==valid.shape[1]
-for name in ['harry','ule','ule']:
+for name in ['harry','terry','ule']:
-train, valid, test = load_sparse_dataset(name)
+train, valid, test = load_sparse_dataset(name, normalize=True)
 nb_elem = numpy.prod(train.shape)
 mi = train.data.min()
 ma = train.data.max()
 mi = min(0, mi)
 ma = max(0, ma)
 su = train.data.sum()
 mean = float(su)/nb_elem
 print name,"dtype, max, min, mean, nb non-zero, nb element, %sparse"
 print train.dtype, ma, mi, mean, train.nnz, nb_elem, (nb_elem-float(train.nnz))/nb_elem
+print name,"max, min, mean, std (all stats on non-zero element)"
+print train.data.max(), train.data.min(), train.data.mean(), train.data.std()
 assert scipy.sparse.issparse(train)
 assert scipy.sparse.issparse(valid)
 assert scipy.sparse.issparse(test)
 assert train.shape[1]==test.shape[1]==valid.shape[1]

Mercurial > pylearn

comparison pylearn/datasets/utlc.py @ 1406:6003f733a994