데이터 집합을 분석 중이므로 회귀 분석을 찾아야합니다. 데이터 세트의 데이터 포인트 수가 Threshold (~ 15)이고 작업에 강력한 선형 회귀를 사용하기로 결정했습니다. 문제는 그 절차가 영향력있는 것으로 보이지 않는 특이점으로 몇몇 점을 선택한다는 것입니다. 다음은 크기의 영향을받는 데이터의 산포도입니다.파이썬 statsmodel 강력한 선형 회귀 (RLM) 이상 값 선택
포인트 B와 C (그림에서 빨간색 원으로 표시)가 이상 값으로 선택되는 반면 영향이 큰 포인트 A는 외래 값으로 선택됩니다. 점 A는 회귀의 일반적인 경향을 변경하지 않지만, 기본적으로 가장 높은 X를 갖는 점과 함께 기울기를 정의합니다. 점 B와 C는 기울기의 유의성에만 영향을줍니다. 그래서 내 질문은 두 부분으로 구성되어 있습니다 : 1) 가장 영향력이 큰 부분을 선택하지 않은 경우 RLM 패키지의 특이점 선택 방법은 무엇이며 내가 알고있는 특이점 선택이있는 다른 패키지를 알고 있습니까? 2) A 점이 이상치라고 생각합니까?