Q 학습을 사용하여 CatPole-v0을 교육하려고합니다.어레이에서 tensorflow 자리 표시 자 먹이기
이ValueError: Cannot feed value of shape (128,) for Tensor 'Placeholder_1:0', which has shape '(?, 2)'
관련 코드는 다음과 같습니다 :
def update_replay_buffer(replay_buffer, state, action, reward, next_state, done, action_dim):
# append to buffer
experience = (state, action, reward, next_state, done)
replay_buffer.append(experience)
# Ensure replay_buffer doesn't grow larger than REPLAY_SIZE
if len(replay_buffer) > REPLAY_SIZE:
replay_buffer.pop(0)
return None
공급 될 수있는 자리
action_in = tf.placeholder("float", [None, action_dim])
수 있습니다 나는 다음과 같은 오류를 얻고 경험을 재생 버퍼를 업데이트하려고 할 때 누군가이 오류를 해결하기 위해 action_dim을 사용해야하는 방법을 분명히 했습니까? action_in
에 의해