Mercurial > ift6266
comparison scripts/CalcPropNist.py @ 93:7054d7afb948
Ajout d'un graphique (histogramme) comparatif pour l'occurence de chaque caractere
author | SylvainPL <sylvain.pannetier.lebeuf@umontreal.ca> |
---|---|
date | Thu, 11 Feb 2010 11:23:35 -0500 |
parents | 708ad2abebdd |
children | 2d671ab3b730 |
comparison
equal
deleted
inserted
replaced
92:708ad2abebdd | 93:7054d7afb948 |
---|---|
8 Sylvain Pannetier Lebeuf dans le cadre de IFT6266, hiver 2010 | 8 Sylvain Pannetier Lebeuf dans le cadre de IFT6266, hiver 2010 |
9 | 9 |
10 ''' | 10 ''' |
11 | 11 |
12 from pylearn.io import filetensor as ft | 12 from pylearn.io import filetensor as ft |
13 import matplotlib.pyplot as plt | |
14 | |
13 | 15 |
14 #f1 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_train_labels.ft') | 16 #f1 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_train_labels.ft') |
15 f1 = open('/data/lisa/data/nist/by_class/all/all_train_labels.ft') | 17 f1 = open('/data/lisa/data/nist/by_class/all/all_train_labels.ft') |
16 train = ft.read(f1) | 18 train = ft.read(f1) |
17 #f2 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_test_labels.ft') | 19 #f2 = open('/home/sylvain/Dropbox/Msc/IFT6266/donnees/all_test_labels.ft') |
57 if test_maj+test_min+test_c != len(test): | 59 if test_maj+test_min+test_c != len(test): |
58 print "probleme avec le test, des donnees ne sont pas etiquetees" | 60 print "probleme avec le test, des donnees ne sont pas etiquetees" |
59 | 61 |
60 if train_maj+train_min+train_c != len(train): | 62 if train_maj+train_min+train_c != len(train): |
61 print "probleme avec le train, des donnees ne sont pas etiquetees" | 63 print "probleme avec le train, des donnees ne sont pas etiquetees" |
64 | |
65 | |
66 #train set | |
67 plt.subplot(211) | |
68 plt.hist(train,bins=62) | |
69 plt.axis([0, 62,0,40000]) | |
70 plt.axvline(x=10, ymin=0, ymax=40000,linewidth=2, color='r') | |
71 plt.axvline(x=36, ymin=0, ymax=40000,linewidth=2, color='r') | |
72 plt.text(3,36000,'chiffres') | |
73 plt.text(18,36000,'majuscules') | |
74 plt.text(40,36000,'minuscules') | |
75 plt.title('Train set') | |
76 | |
77 #test set | |
78 plt.subplot(212) | |
79 plt.hist(test,bins=62) | |
80 plt.axis([0, 62,0,7000]) | |
81 plt.axvline(x=10, ymin=0, ymax=7000,linewidth=2, color='r') | |
82 plt.axvline(x=36, ymin=0, ymax=7000,linewidth=2, color='r') | |
83 plt.text(3,6400,'chiffres') | |
84 plt.text(18,6400,'majuscules') | |
85 plt.text(45,6400,'minuscules') | |
86 plt.title('Test set') | |
87 | |
88 #afficher | |
89 plt.show() |