blas

    5

    2답변

    간단한 프로그램에서 정밀도를 혼합하려고 시도 할 때 - 실제와 이중을 모두 사용하고 BLAS의 ddot 루틴을 사용하면 이중 정밀도 조각에 대한 잘못된 결과가 나타납니다 . program test !! adding this statement narrowed the issue down to ddot being considered real(4) impli

    1

    2답변

    두 개의 임의 길이 벡터 (일반적인 길이는 2048)를 갖기 위해 요소별로 곱하려고합니다. 따라서 모든 n에 대해 Z [n] = X [n] * Y [n]. 16 float inputX[4] = { 2, 4, 8, 16 }; float inputY[4] = { 2, 4, 8, 16 }; catlas_saxpby(4, 1, inputX, 1, 1, inp

    4

    1답변

    일부 소프트웨어의 릴리스를 시도하고 있으며 현재 빌드 프로세스의 스크립트를 통해 작업하고 있습니다. 나는 내가 x86_64 linux에 LAPACK을 정적으로 링크하고 있다고 생각한 적이 없다. 구성 중에 AC_SEARCH_LIB([main],[lapack])이 작동하지만 lapack 장치의 컴파일이 작동하지 않습니다 (예 : undefiend refere

    2

    2답변

    부스트 :: 숫자 :: ublas 행렬에 레벨 1 블래스터를 어떻게 적용합니까? 예를 들어, 최대 항목 또는 모든 항목의 합을 계산하려고합니다. 행렬에 norm_1 또는 norm_inf를 사용하면 컴파일러 오류가 발생하지 않지만 임의의 결과를 반환합니다. 내가 부스트 1.42을 사용하고

    6

    1답변

    CUDA를 사용하여 행렬 곱셈을 구현 한 후. 나는 CUBLAS (포럼의 일부 사람들의 조언 덕분에)로 구현하려고 시도했다. 사각형 행렬을 곱할 수는 있지만 (다시 한 번 ...) 비 사각형 행렬로 작업하는 데 어려움이 있습니다. Matrix A의 너비 (A * B = C)가 다를 때 작동하는 비 정사각 행렬 곱셈의 유일한 유형입니다. 오류가 발생하지 않지

    3

    2답변

    파이썬에서 ctypes를 사용하여 BLAS에서 sgemm 함수를 사용하려고합니다. 잘 C = A X B 다음 코드를 해결하기 위해 노력하고 시도 : 이제 no_trans = c_char("n") m = c_int(number_of_rows_of_A) n = c_int(number_of_columns_of_B) k = c_int(number_of_col

    4

    2답변

    일부 루틴을 사용하려면 Blas 및 Lapack 라이브러리를 사용하고 싶지만 Visual C++ 2010에서 사용하는 방법을 모르겠습니다. 이러한 맥락에서 어떻게 사용합니까?

    4

    1답변

    방금 ​​vecLib 프레임 워크를 사용하여 Mac OS X 10.7에서 집중적 인 행렬 벡터 곱셈을 수행하는 프로그램을 시작했습니다. 이런 간단한 프로그램을 만들었습니다. 행렬 a에 벡터 x를 곱하고 결과를 벡터 y에 더합니다. #include <vecLib/vectorOps.h> #include <stdio.h> float a[8][4] = //

    0

    3답변

    최적화 된 부스트 uBLAS 라이브러리를 사용하기 위해 자신의 벡터 대수 코드를 변환 중입니다. 그러나 SymmetricMatrix-SparseVector 곱셈을 할려고 할 때, 내 구현보다 약 4 배 느린 것으로 나타났습니다. 벡터 크기는 일반적으로 약 0-500이며 약 70-80 % 항목은 0입니다. 여기 내 코드 sparseVectorIndexes 입

    2

    2답변

    밀도가 높은 BLAS의 기능을 복사하는 스파 스 매트릭스 라이브러리가 있습니까? 내가 원하는 것 이상 : 효율적인 SYR 및 스파 스 입력 (및 밀도 출력)와 SYRK (순위-K 업데이트), 스파 스 대칭 저장 옵션, DOT , NRM2, 조 변경 및 기타 표준품. 작업을 수행하는 한 명명 및 API는 BLAS 중심 일 필요는 없습니다. C 또는 Fortr