현재 클러스터 분석을 위해 특이점이있는 정사각형, 원형, 사각형 등과 같이 다른 모양의 데이터 집합을 생성하는 도구를 찾고 있습니다.이상치가있는 여러 모양 (예 : 사각형, 원, 직사각형)의 이발 데이터를 생성하는 방법은 무엇입니까?
클러스터 분석을 위해 좋은 데이터 세트 생성기를 권장 할 수 있습니까? R과 같은 언어로 이러한 데이터 집합을 생성 할 여지가 있습니까?
현재 클러스터 분석을 위해 특이점이있는 정사각형, 원형, 사각형 등과 같이 다른 모양의 데이터 집합을 생성하는 도구를 찾고 있습니다.이상치가있는 여러 모양 (예 : 사각형, 원, 직사각형)의 이발 데이터를 생성하는 방법은 무엇입니까?
클러스터 분석을 위해 좋은 데이터 세트 생성기를 권장 할 수 있습니까? R과 같은 언어로 이러한 데이터 집합을 생성 할 여지가 있습니까?
모양을 만들고 경계 좌표를 추출합니다. splancs
패키지를 사용하여 임의의 점으로 모양을 채울 수 있습니다.
여기 내 프로그램 중 하나에서 작은 조각이다 :
# First we create a circle, into which uniform random points will be generated (kudos to Barry Rowlingson, r-sig-geo).
circle <- function(x = x, y = y, r = radius, n = n.faces){
t <- seq(from = 0, to = 2 * pi, length = n + 1)[-1]
t <- cbind(x = x + r * sin(t), y = y+ r * cos(t))
t <- rbind(t, t[1,])
return(t)
}
csr(circle(0, 0, 100, 30), 1000)
가 이상 값을 추가하시기 바랍니다. 이 문제를 해결하기위한 한 가지 방법은 다양한 모양을 샘플링하고 서로 다른 방식으로 결합하는 것입니다.
임의의 차원으로 다양한 분포를 생성 할 수있는 ELKI의 유연한 데이터 생성기가 있습니다. 또한 예를 들어 감마 분산 변수를 생성 할 수 있습니다. http://elki.dbs.ifi.lmu.de/wiki/DataSetGenerator
가 대단히 :-) 감사)) :-) 많은 도움이 : 위키에 문서
있다 – Pradeep