-
Notifications
You must be signed in to change notification settings - Fork 145
/
rakam_tanima_MLP_MNIST.py
82 lines (65 loc) · 3.68 KB
/
rakam_tanima_MLP_MNIST.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
# -*- coding: utf-8 -*-
"""
Deep Learning Türkiye topluluğu tarafından hazırlanmıştır.
Amaç: El yazısı rakamların tanınması.
Veriseti: MNIST (http://yann.lecun.com/exdb/mnist/)
Algoritma: Çok Katmanlı Algılayıcı (Multi-Layer Perceptron (MLP))
Microsoft Azure Notebook:
20 epoch sonunda %98.40 test doğruluk oranı elde ediliyor.
"""
from __future__ import print_function
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.optimizers import RMSprop
batch_size = 128 # her bir iterasyonda "128" resim alınsın
num_classes = 10 # tanınmak istenen 0-9 rakam (10 sınıf)
epochs = 20 # eğitim 20 epoch(eğitim devir sayısı) sürsün
# the data, shuffled and split between train and test sets
# mnist veriseti rastgele karıştırılmış şekilde train ve set setleri olarak yükleniyor
(x_train, y_train), (x_test, y_test) = mnist.load_data()
# Sinir ağımız her eğitim örneği için tek bir vektör alacaktır,
# bu nedenle girdiyi 28x28 resim tek bir 784 boyutlu vektör olarak şekilde yeniden şekillendiriyoruz.
# Ayrıca girdileri [0-255] yerine [0-1] aralığında ölçeklendireceğiz.
x_train = x_train.reshape(60000, 784)
x_test = x_test.reshape(10000, 784)
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255
print(x_train.shape[0], 'train samples(eğitim örnek sayısı)')
print(x_test.shape[0], 'test samples(test örnek sayısı)')
# sınıf vektörlerini ikili sınıf matrislerine dönüştürüyoruz
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)
# Ağımızı kuralım
# Burada basit bir 3 katmanlı tam bağlantılı ağ yapacağız.(fully connected network ("Dense"))
# Ayrıca eğitim sırasında aşırı öğrenme (overfitting) olmaması için bırakma/atılma ("Dropout") uygulayacağız.
# Dropout tekniği 2014 yılında bir makale de önerilmiştir ve o zamandan beri benimsenerek kullanılmıştır. (http://jmlr.org/papers/v15/srivastava14a.html)
# Pratikte %20 ile %50 arasında dropout uygulandığı görülüyor.
model = Sequential()
model.add(Dense(512, activation='relu', input_shape=(784,)))
model.add(Dropout(0.2))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(num_classes, activation='softmax')) #Softmax katmanı ile çıktı değerlerimizin hepsini bir olasılık dağılımı olarak hesaplanmasını sağlıyoruz.
model.summary()
# Ağ derlenirken kayıp fonksiyonunuzu ve optimizatörünüzü belirtmemiz isteniyor.
# Optimizasyon tiplerinden "RMSprop" ve yitim (loss) fonksiyonu olarak "categorical_crossentropy" kullanıyoruz.
# Son parametre olarak da hali hazırda tanımlanmış tek metrik fonksiyonu olan "accuracy" yi kullanıyoruz. Accuracy bize 0-1 arasında bir doğruluk değeri verecektir.
model.compile(loss='categorical_crossentropy',
optimizer=RMSprop(),
metrics=['accuracy'])
# Burası en eğlenceli kısım, ağımızı eğitme kısmı :)
# Daha önce yüklenmiş eğitim verileri ile sınıflandırmayı öğrenmeye çalışır.
# Fit fonksiyonu eğitim sırasındaki yitim(loss)/doğrulama başarımı (accuracy) değerleri ile bir çok ayrıntı döndürür.
history = model.fit(x_train, y_train,
batch_size=batch_size,
epochs=epochs,
verbose=1,
validation_data=(x_test, y_test))
# Son olarak eğitilmiş ağımızın test setimiz üzerindeki performans değerlerimizi hesaplayarak ekrana yazdıralım.
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])