blas

    3

    2답변

    일반적으로 어셈블리 코드를 통한 성능 향상에 대한 질문에 대한 답변은 "컴파일 작업이 귀찮은 작업이 아닙니다." 그리고 나는 그것을 얻는다. 그러나 최적화 된 선형 대수 라이브러리 (예 : ACML)가 표준 컴파일 된 라이브러리보다 2 배에서 5 배까지 성능이 향상 될 수 있음을 알았습니다. 예를 들어, 제 8 코어 머신에서, 최적화 된 매트릭스 곱셈을 3

    4

    2답변

    GPU를 사용하여 아르마딜로 계산을 실행할 수 있습니까? armadillo에서 GPU blas 라이브러리 (예 : cuBLAS)를 사용할 수 있습니까? 그냥 메모, 전 완전히 GPU 프로그래밍에 새로운입니다.

    2

    1답변

    프로젝트를 ATLAS 라이브러리 -llapack -lf77blas -lcblas -latlas -lgfortran에 연결 했으므로 성공적으로 컴파일 할 수 있습니다. [email protected]:~/Desktop/qt_output$ldd test_atlas linux-vdso.so.1 => (0x00007fffa99ff000) libopencv_co

    2

    1답변

    나는 그 행의 유클리드 표준을 계산할 필요가있는 행렬 M을 가지고있다. 그러한 목적으로 BLAS 라이브러리의 효율성을 사용할 수 있습니까?

    4

    2답변

    Octave와 Julia를 사용하는 큰 사각형 시스템 행렬로 임의의 선형 시스템을 풀려고합니다. 옥타브와 줄리아의 구문이 매우 비슷하기 때문에 나는 옥타브 쉘과 줄리아 쉘 모두에서 다음 코드를 실행합니다 : N = 5000; A = rand(N, N); b = rand(N, 1); x = A\b; r = norm(A*x - b)/norm(b) 옥

    0

    1답변

    다소 우스꽝 스럽지만 OpenBLAS 라이브러리를 프로젝트로 가져 오려고합니다. 그들은 gfortran으로 Fortran 컴파일러로 빌드되었습니다. 초기 빌드는 단지 libopenblas.so을 가져 오는 데 아무런 문제가 없었지만 다른 시스템에서는 거기에 존재하지 않는 프로그램을 실행하려고 시도 할 때 libgfortran.so에서 질식합니다. 필자가 생

    1

    2답변

    드문 드문 한 행렬 D가 있고, D_transpose와 D를 곱해서 다음과 같이 L을 얻고 싶습니다. L = D '* D; 스파 스 매트릭스를 처리하는 데 sparseBLAS를 사용하고 있지만 documentation에는 2 개의 스파 스 매트릭스를 곱할 수있는 정보가 없습니다. 나는 완전히 붙어있어 진행 방법을 모른다. D의 치수는 일반적으로 약 500,

    1

    3답변

    현재 일부 BLAS 기능을 사용하려고합니다. 나는 문서를보고 내가 사용하고 싶은 것을 알고 있지만, 기술 된 기능은 BLAS의 실제 소스 코드에 아무 것도 없다. 나는 단지 그것을 얻지 않는다. blas_xmax_val을 찾으려고합니다. 이 내용은 4230 페이지의 documentation에 나와 있습니다. 그러나 소스 폴더의 아무 곳에서나이 기능을 볼 수

    0

    1답변

    를 인식 할 수 LAPACK 및 BLAS하지만 내 시스템을 컴파일하고 지금에, netlib.org에서의 LAPACK/BLAS 라이브러리를 링크해야 이 프로젝트는 모두 리눅스 환경에 있습니다. 나는 make blaslib make 를 사용하여 만든 그리고 정상적으로 완료, 또는 적어도 난 그렇게 생각, 지정된 Makefile에 gfortran 컴파일러

    93

    5답변

    BLAS, LAPACK 및 ATLAS가 어떻게 관련되어 있고 어떻게 함께 사용해야하는지 이해할 수 없습니다! 나는 모든 매뉴얼을 검토하고 BLAS와 LAPACK에 대한 일반적인 생각과 내가 찾은 몇 가지 예제를 사용하는 방법을 알고 있지만 ATLAS를 사용하여 실제 예제를 찾을 수는 없다. 이 두 사람. 매트릭스에서 저수준 작업을하려고합니다. 기본 언어는