예를 들어 나는 하이브 테이블의 모든 컬럼에 널 (null) 필드의 수를 반환하는 쿼리를 작성해야합니다이 col1|col2|col3
----------------
NULL|a |b
NULL|a |b
e |NULL|f
쿼리가 반환해야 위의 표는 2 1 0입니다. 누군가 제발 도와 줘 ??
저의 목표는 돼지 라틴어로 트윗을 평가하는 것입니다. 사전 (긍정적 인 단어, 부정적인 단어 및 관련없는 단어)으로 사용할 단어 목록이 3 개 있습니다. 이 사전으로 트윗 목록을 평가하고 싶습니다. 나는 트윗의 각 단어를 분석해야한다. 내가 검색 짹짹에게 "프랑스의 성장을"속도가 예 : 목록 긍정적 인 단어 : {좋은, 긍정적 인, 좋은, ...} 목록 부
테이블에 시계열 데이터가 있습니다. 기본적으로 각 행에는 타임 스탬프와 값이 있습니다. 데이터의 빈도는 절대적으로 무작위입니다. 주어진 주파수로 샘플링하고 각 주파수에 대해 관련 정보를 추출하고 싶습니다. 최소, 최대, 최종, 변경 (상대적 이전), 반환 (변경/이전) 및 더 많은 것 (개수 .. .) 그래서 여기 내 입력의 : 08:00:10, 1
08
: coumn 1 = 타임 스탬프 : 문자열, 열 (2) =의 numOfentites : INT 지금 Fri, 10 Aug 2001 274
Fri, 10 Dec 1999 39
Fri, 10 Mar 2000 107
Fri, 10 May 2002 26
Fri, 10 Nov 2000 351
Fri, 10 Sep 1999 22
Fri, 11 Aug 20
나는, COUNT (*)를 참조 전체로 저장하고 나중에 참조하기 위해 노력하고 있지만,이 예에 대한 작동하지 않습니다 : select ((count(*) as total)-count(a)),
(total - count(b)),
(total - count(c))
from table;
무엇이 잘못 되었습니까?
에서와 마찬가지로이 나는, COUNT (*)를 참조 전체로 저장하고 나중에 참조하기 위해 노력하고 있지만, 예를 들면 위해 을 작동하지 않습니다 :이 select ((count(*) as total)-count(a)),
(total - count(b)),
(total - count(c))
from table;
무엇이 잘못 되었
일부 하이브 UDF를 만들었습니다. 이제 우리는 테이블 생성을 위해 하이브리드 내부에서 이러한 UDF를 사용하려고 생각하고 있습니다. 동화 XYZ { 필드 1 ... fieldn } 같은 을 { 가 udf1() udf2() 을 선택 작성 ... ABC에서 UDFN() , def) 이제 우리는 올바른 방법인지 확신 할 수 없습니다. 내 이해에 따라 각 행에