2017-10-18 4 views
0

저는 MNIST 데이터 세트를 사용하여 필기 인식을위한 ConvNet을 구축하고 있습니다. 내 코드는 Theano 백엔드를 사용하여 Keras에 작성되었습니다.출력 클래스를 Theano/Keras의 한 카테고리로 집계하십시오.

클래스의 하위 집합 (예 : 숫자 '1'과 '2'만 가능)을 식별하고 기타 '일반'알 수없는 클래스로 출력 할 수 있도록 ConvNet을 교육하고 싶습니다. 나는 그것이 "Distributed Neural Networks for Internet of Things: The Big-Little Approach"에 설명되어 있기 때문에 이것이 Theano에서 행해질 수 있다는 것을 알고 있지만, 나는이 주제에 대해 어떠한 문서 나 예제도 찾을 수 없다.

답변

0

0, 1, 2, 3, 4, 5 등을 0, 1, 2로 변환 할 목적 함수 출력 (Y_train)을 수정하십시오 (2는 "기타"를 나타냄). 실제로 숫자 5와 6, 그 외 모든 것을 다른 것으로 예측하려면 0에서 시작하도록 클래스의 색인을 다시 생성해야합니다. 따라서 0은 숫자 5가되고 1은 숫자 6이되고 2는 "기타"가됩니다.

'''Trains a simple convnet on the MNIST dataset. 

Gets to 99.25% test accuracy after 12 epochs 
(there is still a lot of margin for parameter tuning). 
16 seconds per epoch on a GRID K520 GPU. 
''' 

from __future__ import print_function 
import keras 
from keras.datasets import mnist 
from keras.models import Sequential 
from keras.layers import Dense, Dropout, Flatten 
from keras.layers import Conv2D, MaxPooling2D 
from keras import backend as K 
import numpy as np 

batch_size = 128 
epochs = 1 

# input image dimensions 
img_rows, img_cols = 28, 28 

# the data, shuffled and split between train and test sets 
(x_train, y_train), (x_test, y_test) = mnist.load_data() 

############################### 
# This is the key... order is important! 
y_train[y_train<=4]=2 
y_train[y_train==5]=0 
y_train[y_train==6]=1 
y_train[y_train>=7]=2 

y_test[y_test<=4]=2 
y_test[y_test==5]=0 
y_test[y_test==6]=1 
y_test[y_test>=7]=2 

num_classes=3 
print(np.unique(y_train)) 
# [0 1 2] 
############################### 

if K.image_data_format() == 'channels_first': 
    x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols) 
    x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols) 
    input_shape = (1, img_rows, img_cols) 
else: 
    x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1) 
    x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1) 
    input_shape = (img_rows, img_cols, 1) 

x_train = x_train.astype('float32') 
x_test = x_test.astype('float32') 
x_train /= 255 
x_test /= 255 
print('x_train shape:', x_train.shape) 
print(x_train.shape[0], 'train samples') 
print(x_test.shape[0], 'test samples') 

# convert class vectors to binary class matrices 
y_train = keras.utils.to_categorical(y_train, num_classes) 
y_test = keras.utils.to_categorical(y_test, num_classes) 

model = Sequential() 
model.add(Conv2D(32, kernel_size=(3, 3), 
       activation='relu', 
       input_shape=input_shape)) 
model.add(Conv2D(64, (3, 3), activation='relu')) 
model.add(MaxPooling2D(pool_size=(2, 2))) 
model.add(Dropout(0.25)) 
model.add(Flatten()) 
model.add(Dense(128, activation='relu')) 
model.add(Dropout(0.5)) 
model.add(Dense(num_classes, activation='softmax')) 

model.compile(loss=keras.losses.categorical_crossentropy, 
       optimizer=keras.optimizers.Adadelta(), 
       metrics=['accuracy']) 

model.fit(x_train, y_train, 
      batch_size=batch_size, 
      epochs=epochs, 
      verbose=1, 
      validation_data=(x_test, y_test)) 
score = model.evaluate(x_test, y_test, verbose=0) 
print('Test loss:', score[0]) 
print('Test accuracy:', score[1]) 
: 여기

은 기본적으로 직선 몇 가지 여분의 라인과의 repo에서의 Keras MNIST example의 수정 된 버전입니다