놀랍게도 웹에서 cilkplus의 배열 표기법에 기반한 BLAS 구현을 추적 할 수 없습니다. cilkplus는 오늘날의 멀티 코어 워크 스테이션 CPU에서 BLAS 알고리즘을 매우 표현적이고 압축 된 표현으로 결합하여 (이상) 성능을 보장해야하기 때문에 이상합니다. 더 이상한 것은 BLAS/LAPACK이 조밀 한 행렬 계산을위한 사실상의 표준이라고 생각하면 (최소한 사양으로).cilkplus 배열 표기법을 사용하는 blas 구현이 있습니까?
blas/lapack을 개선/확장하려고 시도하는 다른 최신 라이브러리가 있음을 이해합니다. 예를 들어 고유 및 플 렌스를 살펴 보았지만 여전히 cilkplus 버전의 "표준"블래스터 구현.
매우 제한된 스프레드에 따라 달라 지나요?