2014-08-30 3 views
5

나는 급속한 광부 5에서 새롭다, 다만 나의 자료에있는 소음을 찾아 내고 그들을 도표에서 보여주고 그 (것)들을 삭제하는 방법 알고 싶다?어떻게 rapidminer에서 노이즈를 감지하고 삭제합니까?

+0

http://stats.stackexchange.com에 게시하여 사용하려는 기술에 관계없이 잡음 제거 (이상치 탐지?)에 대한 조언을 얻을 수도 있습니다. 즉, 귀하의 질문은 원칙과 기술에 관한 두 가지 질문이라고 생각합니다. – fstab

답변

3

복잡한 문제는 노이즈의 의미에 달려 있기 때문입니다.

값이 틀린 개별 속성을 찾으려면 히스토그램보기를 플롯하고 유효한 값을 구성하는 것에 대한 일종의 제한을 찾아야합니다. 그런 다음 Filter Examples을 사용하여 해당 규칙을 적용하여이를 제거 할 수 있습니다.

임의의 종류의 임의의 지터가 적용된 속성을 찾으려면 이러한 속성을 감지하기가 어려울 수 있습니다. 예상되는 분포의 모양이 무엇인지 미리 아는 것만으로 관찰과 비교하고 그것에 대해 뭔가 할 수 있습니다. 그러나 취할 조치는 결코 명백하지 않습니다.

다른 예제와는 분명히 다른 예제 세트에서 예제를 찾는다면 다양한 outlier 함수를 사용할 수 있습니다. 가장 간단한 시작은 Detect Outlier (Distances)입니다. 이것은 예제에 대한 모든 속성을 사용하는 거리 계산을 기반으로 설정된 일련 번호 (기본값 10)를 찾습니다. true 또는 false로 설정된 outlier이라는 새 특성을 만듭니다. 그런 다음 Filter Examples 연산자를 사용하여 true로 설정된 연산자를 제거 할 수 있습니다.

희망은 적어도 시작에 도움이됩니다.