2017-10-24 6 views
1

코드에서 배치를 만드는 문제가 있습니다. 배치 방법을 검색하려고했으나 MNIST 샘플 프로그램에서 next_batch와 같은 방법을 사용하고있었습니다. 만약 누군가 내 프로그램에서 배치를 어떻게 만들어야하는지에 대한 조언을 줄 수 있다면 정말 감사 할 것입니다.배치 텐서 흐름 만들기

import tensorflow as tf 
import numpy as np 
from sklearn import cross_validation 
import pandas as pd 
np.random.seed(20160612) 
tf.set_random_seed(20160612) 

#this is input data, data is a 7x86594 and label is a 5x86594 
data2 = pd.read_csv('rawdata.csv', sep=',', header=None) 
data = np.array(data2) 
label2=pd.read_csv('class.csv', sep='\t', header=None) 
label=np.array(label2) 

train_x,test_x,train_t,test_t=cross_validation.train_test_split(data,label,test_size=0.1,random_state=None) 

#this is supposed to be neural size in hidden layer 
num_units = 15 

x = tf.placeholder(tf.float32, [None, 7]) 
t = tf.placeholder(tf.float32, [None, 5]) 

w1 = tf.Variable(tf.truncated_normal([7, num_units], mean=0.0, stddev=0.05)) 
b1 = tf.Variable(tf.zeros([num_units])) 
hidden1 = tf.nn.relu(tf.matmul(x, w1) + b1) 

w0 = tf.Variable(tf.zeros([num_units, 5])) 
b0 = tf.Variable(tf.zeros([5])) 

p = tf.nn.softmax(tf.matmul(hidden1, w0) + b0) 


loss = -tf.reduce_sum(t * tf.log(tf.clip_by_value(p,1e-10,1.0))) 
train_step = tf.train.AdamOptimizer().minimize(loss) 
correct_prediction = tf.equal(tf.argmax(p, 1), tf.argmax(t, 1)) 
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) 


sess = tf.InteractiveSession() 
sess.run(tf.initialize_all_variables()) 

#this is how i think batching is 

batch_size = 100 
for j in range(0, 86594, batch_size): 
    xs,ys= train_x[j:j+batch_size], train_t[j:j+batch_size] 


i = 0 

for _ in range(4000): 
    i += 1 

    sess.run(train_step, feed_dict={x: xs, t: ys}) 
    if i % 100 == 0: 
     loss_val, acc_val = sess.run([loss, accuracy],feed_dict={x:test_x, t: test_t}) 
     print ('Step: %d, Loss: %f, Accuracy: %f'% (i, loss_val, acc_val)) 

물론이 프로그램의 결과는 옳지 않습니다.

답변

0

데이터 배치를 압축 해제 한 채로 유지하고 교육을 위해 계속 네트워크에 공급합니다. 각 신기원에서 교육 데이터 세트의 모든 샘플을 한 번 실행해야합니다. 그래서 다음과 같은 코드를 다시 작성할 수 있습니다 : 코드 만의

필요한 부분 : 난 당신의 코드 내 코드를 대체하는 경우

epochs = 4000 
batch_size = 100 
for epoch_no in range(epochs): 
    for index, offset in enumerate(range(0, 86594, batch_size)): 
     xs, ys = train_x[offset: offset + batch_size], train_t[offset: offset + batch_size] 
     sess.run(train_step, feed_dict={x: xs, t: ys}) 

     if index % 100 == 0: 
      loss_val, acc_val = sess.run([loss, accuracy], feed_dict = {x: test_x, t: test_t}) 
      print ('Epoch %d, Step: %d, Loss: %f, Accuracy: %f'% (epoch_no, index, loss_val, acc_val)) 
+0

내가 미안하지만, 그것은 같은 500 번 0 단계 실행 프로그램을 만들고, 나는 이것 역시 "중첩"을 시도했지만 결과는 여러 번 프로그램 실행 단계 0과 같았습니다. 배치 섹션의 코드를 잘못 놓았습니까? – mstfa23

+0

@ mstfa23 잘못된 방식으로 인쇄하고있었습니다. 이제는 교육 100 번째 단계마다 모든 신기원에 인쇄됩니다. 그것을 실행하고 다시 확인하십시오. 또한 위 코드를'batch_size = 100' 코드 라인의 모든 코드로 대체하십시오. – user1190882

+0

편집 된 코드를 실행하려고했지만 100 회마다 에포크를 얻는 대신에 9 번에 걸쳐 모든 수에 에포크가 있고 0, 100에 대해 단계가 있습니다. 800까지 그리고 9 번 에포크 1로 이동하고 각 단계마다 단계가 있습니다. 0에서 800까지 (9 번). 나는 당신이 말한 것과 같이 batch_size의 줄에 편집 된 코드를 삽입했다. – mstfa23