-
Notifications
You must be signed in to change notification settings - Fork 0
/
get_confusion_matrix.py
96 lines (82 loc) · 3.61 KB
/
get_confusion_matrix.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
import random
import numpy as np
import seaborn as sns
from tensorflow.keras.preprocessing import image_dataset_from_directory
from tensorflow import keras
from sklearn.model_selection import train_test_split
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
def load_training_dataset(dataset_location='./dataset/',
return_format='numpy',
image_size=(100, 100),
batch_size=32,
shuffle=True):
'''
Charge et retourne un dataset à partir d’un dossier contenant
des images où chaque classe est dans un sous-dossier.
Le dataset est peut être renvoyé comme deux tableaux NumPy, sous
la forme d’un couple (features, label) ; ou comme un Dataset
TensorFlow (déjà découpé en batch).
# Arguments
dataset_location: chemin vers le dossier contenant les images
réparties dans des sous-dossiers représentants les
classes.
return_format: soit `numpy` (le retour sera un couple de
tableaux NumPy (features, label)), soit `tf` (le
retour sera un Dataset TensorFlow).
image_size: la taille dans laquelle les images seront
redimensionnées après avoir été chargée du disque.
batch_size: la taille d’un batch, cette valeur n’est utilisée
que si `return_format` est égale à `tf`.
shuffle: indique s’il faut mélanger les données. Si défini à
`False` les données seront renvoyées toujours dans le
même ordre.
# Retourne
Un couple de tableaux NumPy (features, label) si
`return_format` vaut `numpy`.
Un Dataset TensorFlow si `return_format` vaut `tf`.
'''
ds = image_dataset_from_directory(
dataset_location,
labels='inferred',
label_mode='categorical',
batch_size=batch_size,
shuffle=shuffle if return_format == 'tf' else False,
image_size=image_size,
color_mode='rgb',
interpolation='bilinear'
)
if return_format == 'tf':
return ds
elif return_format == 'numpy':
X = np.concatenate([images.numpy() for images, labels in ds])
y = np.concatenate([labels.numpy() for images, labels in ds])
if shuffle:
idx = list(range(len(X)))
random.shuffle(idx)
X = X[idx]
y = y[idx]
return (X, y)
else:
raise ValueError(
'The `return_format` argument should be either `numpy` (NumPy arrays) or `tf` (TensorFlow dataset).')
if __name__ == "__main__":
class_labels = ['blues', 'classical', 'country', 'disco', 'hiphop', 'metal', 'pop', 'reggae', 'rock', 'jazz']
image_size = (150, 200)
(X, Y) = load_training_dataset(image_size=image_size,dataset_location="images/")
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.3)
X_train = np.array(X_train) / 255.0
X_test = np.array(X_test) / 255.0
model = keras.models.load_model("model/model_60_150x200x3_n3.h5")
y_pred = model.predict(X_test)
con_mat = confusion_matrix(np.argmax(y_test, axis=1), np.argmax(y_pred, axis=1))
con_mat_norm = np.around(con_mat.astype('float') / con_mat.sum(axis=1)[:, np.newaxis], decimals=2)
con_mat_df = pd.DataFrame(con_mat_norm, index=class_labels, columns=class_labels)
figure = plt.figure(figsize=(8, 8))
sns.heatmap(con_mat_df, annot=True, cmap=plt.cm.Blues)
plt.tight_layout()
plt.ylabel('True label')
plt.xlabel('Predicted label')
plt.show()
plt.savefig('confusion_matrix.png')