AVX (ARM NEON에서 제공)를 처음 접했고 AVX에 많은 U8 산술이 부족하다는 사실에 놀라움을 금치 못했습니다. AVX2 : U8의 절대적인 차이
는 그러므로 나는 인라인 함수와max(a,b)-min(a,b)
에 의지했다 :
static inline __m256i _mm256_abd_epu8(__m256i a, __m256i b)
{
return _mm256_sub_epi8(_mm256_max_epu8(a, b), _mm256_min_epu8(a, b));
}
나는이 문제를 다루는보다 효율적인 방법이 있는지 궁금합니다.
예, 저는 _mm256_sad_epu8
을 알고 있지만 그 차이가 필요합니다. 합계가 아닙니다.
모든 입력을 주시면 감사하겠습니다. 이전 버전과의 호환성을 무시하고 AVX2
으로 확인하십시오.
미리 감사드립니다.
와우, 나는 더 포괄적 인 대답을 상상조차 할 수 없다. 정확히 내가 필요로하는 것. 고맙습니다. –
@ Jake'Alquimista'LEE : 건배, 당신이 마이크로 아키텍쳐를 좋아할 거라 생각 했으니 까. –
절대적으로 !!!! 이제 저는 파이프 라인을 더 깊이 파야한다는 것을 알고 있습니다. 당신이 준 링크는 신의 선물입니다. –