나는 급속한 광부 5에서 새롭다, 다만 나의 자료에있는 소음을 찾아 내고 그들을 도표에서 보여주고 그 (것)들을 삭제하는 방법 알고 싶다?어떻게 rapidminer에서 노이즈를 감지하고 삭제합니까?
5
A
답변
3
복잡한 문제는 노이즈의 의미에 달려 있기 때문입니다.
값이 틀린 개별 속성을 찾으려면 히스토그램보기를 플롯하고 유효한 값을 구성하는 것에 대한 일종의 제한을 찾아야합니다. 그런 다음 Filter Examples
을 사용하여 해당 규칙을 적용하여이를 제거 할 수 있습니다.
임의의 종류의 임의의 지터가 적용된 속성을 찾으려면 이러한 속성을 감지하기가 어려울 수 있습니다. 예상되는 분포의 모양이 무엇인지 미리 아는 것만으로 관찰과 비교하고 그것에 대해 뭔가 할 수 있습니다. 그러나 취할 조치는 결코 명백하지 않습니다.
다른 예제와는 분명히 다른 예제 세트에서 예제를 찾는다면 다양한 outlier 함수를 사용할 수 있습니다. 가장 간단한 시작은 Detect Outlier (Distances)
입니다. 이것은 예제에 대한 모든 속성을 사용하는 거리 계산을 기반으로 설정된 일련 번호 (기본값 10)를 찾습니다. true 또는 false로 설정된 outlier
이라는 새 특성을 만듭니다. 그런 다음 Filter Examples
연산자를 사용하여 true로 설정된 연산자를 제거 할 수 있습니다.
희망은 적어도 시작에 도움이됩니다.
http://stats.stackexchange.com에 게시하여 사용하려는 기술에 관계없이 잡음 제거 (이상치 탐지?)에 대한 조언을 얻을 수도 있습니다. 즉, 귀하의 질문은 원칙과 기술에 관한 두 가지 질문이라고 생각합니다. – fstab