pylearn: dataset.py comparison

comparison dataset.py @ 435:eac0a7d44ff0

merge

author	Olivier Breuleux <breuleuo@iro.umontreal.ca>
date	Mon, 04 Aug 2008 16:29:30 -0400
parents	52b4908d8971
children	739612d316a4 ce6b4fd3ab29

comparison

equal deleted inserted replaced

-:0f366ecb11ee
+:eac0a7d44ff0
 len(dataset) returns the number of examples in the dataset.
 By default, a DataSet is a 'stream', i.e. it has an unbounded length (sys.maxint).
 Sub-classes which implement finite-length datasets should redefine this method.
 Some methods only make sense for finite-length datasets.
 """
-return None
+from sys import maxint
+return maxint
 class MinibatchToSingleExampleIterator(object):
 """
 Converts the result of minibatch iterator with minibatch_size==1 into
 self.fieldname2dataset[fieldname]=i
 for fieldname,i in names_to_change:
 del self.fieldname2dataset[fieldname]
 self.fieldname2dataset[rename_field(fieldname,self.datasets[i],i)]=i
+def __len__(self):
+return len(self.datasets[0])
 def hasFields(self,*fieldnames):
 for fieldname in fieldnames:
 if not fieldname in self.fieldname2dataset:
 return False
 return True
 # - James 22/05/2008
 self.fields_columns[fieldname]=[fieldcolumns]
 else:
 self.fields_columns[fieldname]=fieldcolumns
 elif type(fieldcolumns) is slice:
-start,step=None,None
+start,step=fieldcolumns.start,fieldcolumns.step
-if not fieldcolumns.start:
+if not start:
 start=0
-if not fieldcolumns.step:
+if not step:
 step=1
-if start or step:
+self.fields_columns[fieldname]=slice(start,fieldcolumns.stop,step)
-self.fields_columns[fieldname]=slice(start,fieldcolumns.stop,step)
 elif hasattr(fieldcolumns,"__iter__"): # something like a list
 for i in fieldcolumns:
 assert i>=0 and i<data_array.shape[1]
 def fieldNames(self):
 Note that the expected semantics of the function differs in minibatch mode
 (it takes minibatches of inputs and produces minibatches of outputs, as
 documented in the class comment).
-TBM: are filedtypes the old field types (from input_dataset) or the new ones
+TBM: are fieldtypes the old field types (from input_dataset) or the new ones
 (for the new dataset created)?
 """
 self.input_dataset=input_dataset
 self.function=function
 self.output_names=output_names
+#print 'self.output_names in afds:', self.output_names
+#print 'length in afds:', len(self.output_names)
 self.minibatch_mode=minibatch_mode
 DataSet.__init__(self,description,fieldtypes)
 self.valuesHStack = values_hstack if values_hstack else input_dataset.valuesHStack
 self.valuesVStack = values_vstack if values_vstack else input_dataset.valuesVStack
 input_examples = zip(*input_fields) #makes so that [i] means example i
 output_examples = [self.function(*input_example)
 for input_example in input_examples]
 all_output_fields = zip(*output_examples)
+#print 'output_names=', self.output_names
+#print 'all_output_fields', all_output_fields
+#print 'len(all_output_fields)=', len(all_output_fields)
 all_outputs = Example(self.output_names, all_output_fields)
-#print 'input_fields', input_fields
-#print 'all_outputs', all_outputs
 if fieldnames==self.output_names:
 rval = all_outputs
 else:
 rval = Example(fieldnames,[all_outputs[name] for name in fieldnames])
 #print 'rval', rval

Mercurial > pylearn

comparison dataset.py @ 435:eac0a7d44ff0