으로 분석하고 싶습니다. 시장 바구니 분석에서 어떤 항목이 잘 어울리지 않았습니까? 기본적으로 함께있는 항목을 찾지 못하면 대기열에서 빠져 나옵니다. 나는 다양한 속성의 조합으로 인해 레코드 (13 개 속성/열 포함)가 불완전한 상황이 있습니다. 예 : a1, a2 .... a13에 대해서는 입니다. 위의 모든 속성은 값을 가질 수도 있고 그렇지 않을 수도 있습니다. 그러나 값이없는 모든 속성은 레코드가 불완전하게됩니다.시장 바구니 분석의 역수를 R
이 상황에서 불완전 레코드의 조합이 주로 내 레코드 세트에서 발생하는 것을 확인해야합니다. 이 패턴을 아는 것은 우리 팀이 가장주의를 기울여야 할 기록의 우선 순위를 정하는 데 도움이됩니다. Apriori 알고리즘은 사용 가능한 값만 사용하는 것을 볼 수 있지만 발생하지 않는 조합을 분석해야합니다. 나는이 문제가 과거에 풀려 있었음에 틀림 없다고 확신하지만 포럼에서 어떤 힌트도 보지 못했다. 그런 종류의 경험이있는 사람이 있습니까? 아니면 내가 사용해야하는 다른 알고리즘을 제안합니까? 나는이 분석을 위해 R을 사용하고있다. 그리고 총 기록 : 218k
데이터에 적합한 통계 분석 방법을 선택하는 데 도움이 필요하면 [stats.se] 또는 [datascience.se]에 질문을 게시해야합니다. 이것은 정말로 특정한 프로그래밍 질문이 아닙니다. R을 사용한다는 사실은 데이터를 분석하는 적절한 방법을 선택하는 것과 관련이 없습니다. – MrFlick