data-mining

    0

    1답변

    최근에 Dimension Reduction 메서드를 연구 중이며 python 패키지 "sklearn.feature_selection"이 매우 유용하지만, 문제는 SelectPercentile.fit 메서드가 점수 함수를 계산하는 방법을 설명하지 않는다는 것을 알았습니다. 그것이 어떻게 작동하는지 link 는 아는 사람 있나요? Advanced에 감사드립니다

    -3

    1답변

    구조화되지 않은 데이터 (앱의 스크린 샷)와 반 구조화 된 데이터 (화면 덤핑 파일)가 있는데 hbase에 저장하도록 선택했습니다. 내 목표는 결함 또는 앱의 문제 (의미있는 데이터)를 찾는 것입니다. 자, 데이터 마이닝을 적용하여 텍스트 마이닝의 일종입니까? 이 데이터에 대해 일부 데이터 마이닝 기술을 적용하려면 어떻게해야합니까?

    0

    1답변

    내 데이터에 Aprioiri 알고리즘을 구현 중입니다. 데이터는 약 81 개의 속성을 가진 거의 700 개의 레코드를 가지고 있습니다. 해당 데이터에 대한 연결 규칙을 생성하려고합니다. 이 내 프로그램의 코드입니다 public class Aprioritest { /** * @param args the command line arguments */

    0

    1답변

    RapidMiner를 배우고 있습니다. 데이터 세트에서 Linear Regresion을 실행하고 싶습니다. 하지만이 방법/기법 다항식 특성을 처리 할 수 ​​없다는 오류가 있어요. 이 문제를 파악하는 가장 좋은 방법은 무엇입니까? 이러한 속성은 기본 문자열이며 매우 중요한 입력입니다. 문자열, 다항식 특성을 숫자 또는 정수로 변환하는 방법이 있습니까?

    0

    2답변

    나는 Kaggle에서 얻은 데이터 세트에 대한 의사 결정 트리를 만들려고합니다. 실제 데이터 세트를 다루는 데 대한 경험이 없기 때문에 데이터 정리, 통합 및 스케일링 (주로 스케일링)을 처리하는 방법을 알지 못합니다. 예를 들어, 실제 숫자가있는 기능이 있다고 가정 해 보겠습니다. 그래서 특정 그룹 수 (소수의 의사 결정 트리 만들기)로 확장하여 범주 형

    0

    1답변

    GloVe를 사용하여 문서에 단어 삽입을 구성하려고합니다. 다음과 같이 단일 단어 (unigrams)에 대한 벡터 삽입을 얻는 방법을 알고 있습니다 (예제 텍스트 문서의 경우). $ git clone http://github.com/stanfordnlp/glove $ cd glove && make $ ./demo.sh 이제 bigram의 벡터 삽입을

    0

    1답변

    버텍스 에지 오버랩, 자카드, 코사인, 편집 거리, 시그너처 유사성, 람다 거리, 델타콘 등과 같은 그래프 유사성 계산에 관한 많은 이론이 있습니다. 이러한 것들은 그래프의 단일 가장자리를 기반으로합니다. 그러나 현실 세계에는 여러 개의 가장자리를 갖는 그래프가 많이 있습니다. 위와 비슷한 두 개의 그래프가 주어지면 그래프의 유사도를 어떻게 계산할 수 있습

    1

    1답변

    다양한 기계 학습 도구 (신경망 및 DL, ID 트리, SVM과 같은 다양한 관련 기술)에 대한 온라인 자습서가 온라인으로 많이 있습니다. 소규모 기계 학습을 Python이나 MATLAB 또는 그와 동등한 방법으로 수행 할 때 대개 기능이있는 CSV 파일과 라벨이있는 CSV 파일이 있으며,이 파일을 메모리에로드 한 다음 프로그램에서 요구하는대로 구성합니다

    -1

    1답변

    나는 다음과 같은 테이블이있는 경우 : 그리고 만약 A = {I1}, B는 = {I2}, 나는 지원이 0.4과 자신감을 찾을 연관 규칙 A ⇒ B에 대해 0.5이면, 이것이 강력한 연관 규칙인지 여부를 어떻게 결정할 수 있습니까? 예를 들어, 최소 지원이 30 %라면 강한 상상을받을 것입니다. 맞습니까? 우리의 지원은 0.4로 계산 되었기 때문입니다. 그러

    0

    1답변

    이것을 보면 최적의 클러스터 수를 어떻게 알 수 있습니까? 나는 K-means를 사용하고 최적의 점을 보여주는 그래프에서 "팔꿈치"를 찾았으나 이것은 단지 멍멍 막에서 이것을 알아내는 데 어려움을 겪고 있습니다.