현재 텍스트를 분류하려고합니다. 데이터 세트가 너무 크고 here으로 제안되었으므로 스파 스 매트릭스를 사용해야합니다. 내 질문은 지금, 스파 스 매트릭스에 요소를 추가하는 올바른 방법은 무엇입니까? 예를 들어, 행렬 X가 제 입력이라고 가정 해 봅시다.SciPy NumPy 및 SciKit 배우고 희소 행렬을 만듭니다.
X = np.random.randint(2, size=(6, 100))
이 매트릭스 X는 ndarray (또는 이와 비슷한 것)의 ndarray처럼 보입니다. 내가
X2 = csr_matrix(X)
내가 스파 스 매트릭스를 수행하지만 어떻게 내가으로 sparce 행렬에 다른 요소를 추가 할 수 있습니다
? 예를 들어이 고밀도 요소 : [1,0001110, ..., 0,1,0]을 스파 스 벡터에 넣으면 스파 스 입력 행렬에 어떻게 추가합니까?
당신이 정말로 이가 시도하기 전에 읽어야 할 좋은 자습서, Scikit는 배우기
당신은 정말로 이것을 읽어야합니다 : http://scikit-learn.org/dev/auto_examples/dvument_classification_20newsgroups.html – zenpoy
이것은 두 번째 날이 파이썬으로 작업하는 두 번째 날입니다. 나는 그것도 발견했다 btw – Ojtwist
어떤 것은 단순히 그들의 시간을 가져 간다. 어쩌면 Python, Numpy 및 Scipy에 대한 자습서를 작성하는 데 시간을 투자해야합니다. 예를 들어, 다른 질문의 대답에서 나는 몇 가지 링크를 지적했고, 젠포는 또 다른 질문을했습니다. 나는 당신이 그 링크를 읽지 않았다고 가정합니다. 다른 질문에 답한 후 몇분 만이 질문을 게시했기 때문입니다. – HerrKaputt