-
Notifications
You must be signed in to change notification settings - Fork 0
/
main.py
109 lines (93 loc) · 3.93 KB
/
main.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
import random
import numpy as np
from keras import Model
from keras.applications.inception_resnet_v2 import InceptionResNetV2
from keras.applications.xception import Xception
from keras.applications.nasnet import NASNetLarge
from tensorflow.keras.preprocessing import image_dataset_from_directory
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Model
from sklearn.model_selection import train_test_split
from tensorflow.keras.optimizers import Adam
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array
def load_training_dataset(dataset_location='./dataset/',
return_format='numpy',
image_size=(100, 100),
batch_size=32,
shuffle=True):
'''
Charge et retourne un dataset à partir d’un dossier contenant
des images où chaque classe est dans un sous-dossier.
Le dataset est peut être renvoyé comme deux tableaux NumPy, sous
la forme d’un couple (features, label) ; ou comme un Dataset
TensorFlow (déjà découpé en batch).
# Arguments
dataset_location: chemin vers le dossier contenant les images
réparties dans des sous-dossiers représentants les
classes.
return_format: soit `numpy` (le retour sera un couple de
tableaux NumPy (features, label)), soit `tf` (le
retour sera un Dataset TensorFlow).
image_size: la taille dans laquelle les images seront
redimensionnées après avoir été chargée du disque.
batch_size: la taille d’un batch, cette valeur n’est utilisée
que si `return_format` est égale à `tf`.
shuffle: indique s’il faut mélanger les données. Si défini à
`False` les données seront renvoyées toujours dans le
même ordre.
# Retourne
Un couple de tableaux NumPy (features, label) si
`return_format` vaut `numpy`.
Un Dataset TensorFlow si `return_format` vaut `tf`.
'''
ds = image_dataset_from_directory(
dataset_location,
labels='inferred',
label_mode='categorical',
batch_size=batch_size,
shuffle=shuffle if return_format == 'tf' else False,
image_size=image_size,
color_mode='rgb',
interpolation='bilinear'
)
if return_format == 'tf':
return ds
elif return_format == 'numpy':
X = np.concatenate([images.numpy() for images, labels in ds])
y = np.concatenate([labels.numpy() for images, labels in ds])
if shuffle:
idx = list(range(len(X)))
random.shuffle(idx)
X = X[idx]
y = y[idx]
return (X, y)
else:
raise ValueError(
'The `return_format` argument should be either `numpy` (NumPy arrays) or `tf` (TensorFlow dataset).')
if __name__ == "__main__":
image_size = (331, 331)
(X, Y) = load_training_dataset(image_size=image_size)
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.3)
X_train = np.array(X_train) / 255.0
X_test = np.array(X_test) / 255.0
num_classes = 3
input_shape = (331, 331, 3)
base_model = InceptionResNetV2(weights='imagenet', include_top=False,
input_shape=input_shape)
base_model.trainable = False
model = keras.Sequential(
[
base_model,
layers.Flatten(),
layers.Dropout(0.4),
layers.Dense(7, activation="relu"),
layers.Dense(num_classes, activation="softmax"),
]
)
model.compile(loss='categorical_crossentropy', optimizer="adam", metrics=['accuracy'])
model.summary()
model.fit(X_train, y_train, batch_size=2, epochs=10, validation_data=(X_test, y_test))
model.save('trained_model/modeltest.h5')
prediction_probas = model.evaluate(X_test, y_test)
print(prediction_probas)