NLP에서는 항상 피쳐의 크기가 매우 큰 경우입니다. 예를 들어 한 프로젝트의 경우, 피쳐의 크기는 거의 20,000 (p = 20,000)이며, 각 피쳐는 특정 단어 나 바이 그램이 종이에 표시되는지 여부를 나타내는 0-1 정수입니다 (한 종이 R^{p} $의 데이터 점 $ x \입니다. 필자는 기능 중 중복성이 매우 커서 크기 축소가 필요하다는 것을 알
모양 (29421, 11001) 인 매트릭스 (ndarray)에서 주어진 제한 f보다 큰 상관 계수를 찾으려면 this 답변을 사용하고 있습니다.) [즉 29,421 행 및 11,001 열]. 다음 I 코드를 적응 한 는 (랜덤 비트를 제거하는 두 개의 열 중 하나를 선택하는 부가 적으로, 링크 된 대답에 대응하는 행이 그 후 "###"가) 문제 : 나는
나는 벡터 집합을 가지고있다. I,이 단일 값이 벡터의 특징 값 있어야 (x1,x2,....,xn) ------> y
말 단항 값 (1-d)에 대한 N 차원 벡터를 줄이는 방법에 노력하고있다. 각 고유 벡터는 고유 한 출력 값을 생성합니다. 다음 방법 중 어느 것이 적합하다 : 1- 벡터의 표준 - 제곱의 합의 제곱근 충돌 회피 일부 해싱 기법을 이용하
매핑에 문제가 있습니다. [0,1 .... N-1] ~ 1과 같이 하나의 그룹/포인트로 N 차원 벡터를 매핑해야합니다. [1,2 .... N-1] to 2 문제는 바로 지금 제가 차원 벡터를 받고 리턴 점 하나를 가지므로, 그 점은 결과입니다. 함수를 호출하면 이미 모든 결과가 테이블에 저장되어 있습니다. 문제는 함수를 제거하고 새 항목을 기존 점에 매핑해
고차원 데이터 세트를 2 차원으로 축소하려고합니다. 그러나 전 데이터 세트 전체에 액세스 할 수는 없습니다. 그래서, N 차원 벡터를 취하여 2 차원 벡터를 반환하는 함수를 생성하고 싶습니다. 즉, N 차원 공간에서 가까운 벡터에주는 경우, 결과는 2 차원으로 가깝습니다. 공간. SVD가 내가 필요한 대답이라고 생각했지만 제대로 작동하지 않습니다. 간단히하
는 y=2;
z=4;
[email protected](x,y,z) x.^2+y.^2+z.^2;
말하게 그리고 [0,1]에서 X에 대한 F를 통합하려는. 내가 g을 정의해야 및 쿼드처럼 이 [email protected](x) f(x,y,z);
quad(g,0,1)
내가 가진 문제는 F에 쿼드을 할 수 있는지 여부입니다 직접 새 기능을 정의하지
나는 많은 시간을 사용해 왔지만 어떻게 든 작동하지 않습니다. 그리고 이것은 고급 R 사용자에게 쉽습니다. 각 요소가 선형으로 발생하는 Dataformat이 있습니다. 먼저 공백과 1000 개 숫자 기능 뒤에 문자열로 라벨, splited : 매트릭스 (첫 번째 행 또는 항상 첫 번째 열)을 읽을 때 "label1" 1 0 1 0 0 0 ...
"labe
OCR에서 내 프로젝트를하고 있습니다. 64x64의 이미지 크기를 사용하고 있는데, 32x32 등의 픽셀을 사용하려고 시도했을 때 일부 픽셀이 손실되었습니다. 영역 밀도, Zernike의 순간, 투영 히스토그램, 거리 프로파일, 교차점 등의 기능을 시도했기 때문입니다. 주요 문제는 특징 벡터 크기가 너무 큽니다. 나는 위의 기능의 조합을 가지고 try.Bu
2 개의 다른 시점에서 5 개의 장치를 측정했습니다. 측정 단위는 기본적으로 대응하는 위치에서의 비트 값에 대응하는 1과 0의 배열 구성 whos measurement1_dev1_time1
Name Size Bytes Class Attributes
measurement1_dev1_time1 4096x8 32768 logica