flops

    0

    1답변

    애플리케이션을 실행하지 않고 HPC 애플리케이션 (NAS 벤치 마크)의 mflops (프로세서 당 초당 연산 수)를 계산하고 싶습니다. Stream Benchmark를 사용하여 시스템의 각 코어 (슈퍼 컴퓨터)의 메모리 대역폭을 측정했습니다. 코어의 메모리 대역폭 정보를 가지고 애플리케이션의 프로세서 당 mflops를 얻는 방법을 알고 싶습니다. 내 노드는

    1

    1답변

    CPU의 최대 FLOPS 성능을 측정하기 위해 C++ programm를 작성했습니다. 그러나 측정 결과는 나에게 CPU의 이론적 인 최대 FLOPS보다 큰 결과를 제공합니다. 뭐가 잘못 되었 니? 이 I 쓴 코드 : #include <iostream> #include <mmintrin.h> #include <math.h> #include <chrono

    0

    1답변

    나누기 연산이있는 경우 알고리즘을 측정 할 때 FOP 및 부동 소수점 성능의 총 수를 계산하는 방법은 무엇입니까? 예를 들어, n2 행렬 곱셈, n3 * 2flops (곱셈, 덧셈)의 계산, 같은 데이터 세트 n2를 사용한다고 가정 할 때 행렬 곱셈의 곱셈 연산을 나누기 연산으로 변경하는 방법 슬리퍼. 행렬 곱셈의 결과와 동일합니까?

    2

    1답변

    OpenCL 및 OpenGL 응용 프로그램의 성능을 예측하기 위해 GPU를 모델링하고 있습니다 (모델을 공개 할 수 없음). 모델에서 실행중인 응용 프로그램/커널/코드의 FLOPS를 합리적으로 예측할 수 있습니다. FLOPS에서 초당 프레임 수를 계산하거나 프레임 버퍼를 모델링하고 그로부터 FPS를 계산하는 것이 좋습니다.

    3

    1답변

    FLOPS의 개념을 완전히 이해하지 못하는 것 같습니다. CUDA SAMPLES에는 행렬 곱셈 예제 (0_Simple/matrixMul)가 있습니다.가 double flopsPerMatrixMul = 2.0 * (double)dimsA.x * (double)dimsA.y * (double)dimsB.x; 그래서, 이러한 수단, 즉 B(m x k) 위에

    0

    1답변

    기계 학습 알고리즘을 프로파일 링하기 위해 tfprof를 사용했습니다. 다음은 샘플 출력입니다. ================== 모델 분석 보고서 ==================== 노드 이름 | (-/3163.86b 플롭) InceptionResnetV2/InceptionResnetV2/Mixed_6a/Branch_1/Conv2d_0b_3x3/컨볼 루

    1

    1답변

    perf_event.h을 사용하여 특정 실행중인 프로세스의 IPC을 계산하는 프로그램이 있습니다. 나는 지침 카운터와 CPU_CYCLES 카운터를 읽었습니다. 내 질문에 대한 답변은 안내문에 의해 반환 된 것입니다. 부동 소수점 연산이 포함되어 있습니까? 그렇지 않다면이 값을 어떻게 얻을 수 있습니까? 참고 : 나는 perf_event.h에 대한 을 이야기

    0

    1답변

    나는 추출 얼마나 많은 플롭 (부동 소수점 연산) 내 각각의 알고리즘은 내가 FPGA에 또는 CPU에이 알고리즘을 구현하는 경우 궁금 는 (대략 최소) 얼마나 많은 전력 예측할 수, 소모 소비 될 것인가? CPU 또는 ASIC/FPGA 중 하나에서 전력을 추정하는 것이 좋습니다. 나는 수식과 같은 것을 찾고 있습니다. 인텔 CPU의 경우 this journ

    7

    1답변

    나는 꽤 오랫동안 찾고 있었고 인텔 제온 쿼드 코어가 완료 할 수있는 단 정밀도 부동 소수점 연산/클럭 사이클의 수를 공식적으로/결정적으로 나타내는 숫자를 찾을 수없는 것 같습니다. Intel Xeon 쿼드 코어 E5530 CPU를 가지고 있습니다. 내 CPU가 달성 할 수있는 최대 이론적 FLOP/s를 계산할 때이 값을 사용하고 싶습니다. MAX는 슬리퍼

    0

    1답변

    예 : _TFProfRoot (--/3163.86b flops) InceptionResnetV2/InceptionResnetV2/Mixed_6a/Branch_1/Conv2d_0b_3x3/convolution (173.41b/173.41b flops) b flops은 무엇을 의미합니까? m flops은 mega flops을 의미합니다. 그러나 'b' f