다음 코드 세그먼트의 경우 모든 잠재적 파이프 라인 위험을 해결하려면 최소 nop 수를 삽입해야합니다. lw $t3, 4($t5)
beq $t2, $t3, -2
addi $t2, $t2, 1
내가 제안 된 솔루션 그러나 lw $t3, 4($t5)
beq $t2, $t3, -2
addi $t2, $t2, 1
NOP
NOP
, 나는 위의
캐시 크기 (L1, L2, L3)를 얻기위한 프로그램을 작성하고 싶습니다. 나는 그것의 일반적인 생각을 안다. 큰 배열을 다른 크기의 그것의 액세스 부분마다 할당합니다. 그래서 나는 작은 프로그램을 작성했습니다. #include <cstdio>
#include <time.h>
#include <sys/mman.h>
const int KB = 1024
컴퓨터 시스템 : 프로그래머의 관점, 그리고 Macbook Pro에서 제공하는 코드를 Intel Core i7과 함께 실행하려고합니다. . 그러나 일부 코드는 책의 제안대로 정확하게 실행되지 않습니다. 이 C 예제는 레지스터에 저장 될 때부터 메모리에 저장 될 때 동일한 부동 소수점이 다를 것임을 보여줍니다. #include<stdio.h>
double
MIPS ISA를 설명하는 다음 URL에서 강의를 보았습니다. http://www.youtube.com/watch?v=DVFwXvxyC38&list=PLD8AF625E53B0691F&index=4 원경 내 이해에 따르면 MIPS의 32 비트 는, 메인 메모리 32 비트 어드레스 입력 버스를 갖는 메모리에 각각의 슬롯은 8 비트, 각각의 어드레스를 보유 8
언어 별 아키텍처/프로세서 주제에서 Computer Architecture 클래스에 대한 연구 논문을 쓰고 있습니다. 분명히이 주제의 두 가지 주요 구성 요소는 LISP 머신과 Java 컴퓨터입니다. 그러나 Google을 통해 더 많은 정보를 찾는 데 어려움을 겪고 있습니다. 나는이 주제와 관련하여 참고 문헌, 새로운 하위 주제, 논문, 저널, 서적 등의
현재 여러 개의 코어로 프로그래밍하려고합니다. C++/Python/Java로 병렬 행렬 곱셈을 작성하거나 구현하고 싶습니다 (Java가 가장 단순한 것 같습니다). 하지만 스스로 대답 할 수없는 한 가지 질문은 RAM 액세스가 여러 CPU에서 어떻게 작동하는지입니다. 내 생각 우리 두 행렬 A와 B. 우리는 C가 A *의 B를 = 산출 할 가지고 병렬 실행
"컴퓨터 아키텍처 : A 정량적 접근법 5th ed"를 통해 읽었으며 Amdahl의 법칙을 파악하려고합니다. 시스템의 속도를 높이면 속도가 빨라집니다 특정 비율의 시스템 비율. 특정 요인에 의해 시스템 속도를 높이는 것에 대해 이야기 할 때 이해하기 쉽습니다. 10 배 빠른 시스템. 는 구체적인 예를 제공합니다 : 당신은 특정 하위 시스템이 실행 시간의 7
매우 일반적인 질문 일 수도 있지만 캐시 벤치 마크 코드에서 얻은 커브에 대한 설명이 필요합니다. 여기서 목표는 캐시 라인 크기를 찾는 것입니다. 여기에서 코드를 사용했습니다 : (h ** ps : //github.com/jiewmeng/cs3210-assign1/blob/master/cache-l1-line.cpp) 이것은 내가 얻은 곡선입니다. 내 컴퓨