comparison scripts/CalcPropNist.py @ 93:7054d7afb948

Ajout d'un graphique (histogramme) comparatif pour l'occurence de chaque caractere
author SylvainPL <sylvain.pannetier.lebeuf@umontreal.ca>
date Thu, 11 Feb 2010 11:23:35 -0500
parents 708ad2abebdd
children 2d671ab3b730
comparison
equal deleted inserted replaced
92:708ad2abebdd 93:7054d7afb948
8 Sylvain Pannetier Lebeuf dans le cadre de IFT6266, hiver 2010 8 Sylvain Pannetier Lebeuf dans le cadre de IFT6266, hiver 2010
9 9
10 ''' 10 '''
11 11
12 from pylearn.io import filetensor as ft 12 from pylearn.io import filetensor as ft
13 import matplotlib.pyplot as plt
14
13 15
14 #f1 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_train_labels.ft') 16 #f1 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_train_labels.ft')
15 f1 = open('/data/lisa/data/nist/by_class/all/all_train_labels.ft') 17 f1 = open('/data/lisa/data/nist/by_class/all/all_train_labels.ft')
16 train = ft.read(f1) 18 train = ft.read(f1)
17 #f2 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_test_labels.ft') 19 #f2 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_test_labels.ft')
57 if test_maj+test_min+test_c != len(test): 59 if test_maj+test_min+test_c != len(test):
58 print "probleme avec le test, des donnees ne sont pas etiquetees" 60 print "probleme avec le test, des donnees ne sont pas etiquetees"
59 61
60 if train_maj+train_min+train_c != len(train): 62 if train_maj+train_min+train_c != len(train):
61 print "probleme avec le train, des donnees ne sont pas etiquetees" 63 print "probleme avec le train, des donnees ne sont pas etiquetees"
64
65
66 #train set
67 plt.subplot(211)
68 plt.hist(train,bins=62)
69 plt.axis([0, 62,0,40000])
70 plt.axvline(x=10, ymin=0, ymax=40000,linewidth=2, color='r')
71 plt.axvline(x=36, ymin=0, ymax=40000,linewidth=2, color='r')
72 plt.text(3,36000,'chiffres')
73 plt.text(18,36000,'majuscules')
74 plt.text(40,36000,'minuscules')
75 plt.title('Train set')
76
77 #test set
78 plt.subplot(212)
79 plt.hist(test,bins=62)
80 plt.axis([0, 62,0,7000])
81 plt.axvline(x=10, ymin=0, ymax=7000,linewidth=2, color='r')
82 plt.axvline(x=36, ymin=0, ymax=7000,linewidth=2, color='r')
83 plt.text(3,6400,'chiffres')
84 plt.text(18,6400,'majuscules')
85 plt.text(45,6400,'minuscules')
86 plt.title('Test set')
87
88 #afficher
89 plt.show()