친구! 여러 GPU로 처리하는 것에 대해 질문이 있습니다. 나는 4 개의 gpus를 사용하고 있으며 아래처럼 3 가지 방법으로 간단한 A^n + B^n 예제를 시도했다.여러 Gpu로 Tensorflow 처리 성능
단일 GPU
with tf.device('/gpu:0'): ....tf.matpow codes...
다중 GPU
with tf.device('/gpu:0'): ....tf.matpow codes... with tf.device('/gpu:1'): ....tf.matpow codes...
지정 없음 특정 GPU 없습니다
....just tf.matpow codes...
시도했을 때 그 결과는 이해할 수 없었습니다. 결과였다 1 개의 GPU : 6.x의 초 2. 여러 개의 GPU (2 개 GPU를) 2.X 초 3. 지정없이 특정 GPU (아마 4의 GPU) : 4.x의 초
I 왜 # 2가 # 3보다 빠르는지 이해할 수 없다. 누구든지 나를 도울 수 있습니까?
감사합니다.
# 3는 GPU를 사용합니다 : 0. 또한 GPU에서 첫 번째 커널을 실행하면 GPU 당 몇 초가 걸릴 수 있습니다. 타이밍을 시작하기 전에 GPT를 실행하여 GPU를 미리 예열해야합니다. http://stackoverflow.com/questions/40410210/tensorflow-2 -gpu-slower-then-single-gpu/40430717 # 40430717 –
초기화시 각 GPU 장치에 대해 연산 연산의 PTXAS 컴파일이 수행됩니다. –