상세 보기
초록
회귀모형에 연관성이 높은 설명변수들이 포함되면 다중공선성의 문제가 야기되며, 동시에 자료에 회귀이상점들이 포함되면 최소자승추정량에 바탕을 둔 제반 통계적 추론은 심각한 결함을 갖게 된다. 이러한 현상들은 데이터마이닝 분야에서 많이 볼 수 있는데, 본 논문에서는 두 가지 문제를 동시에 해결하기 위한 방안으로서 로버스트주성분회귀를 제안하였다. 특히 최적의 주성분을 선정하기 위한 새로운 기준을 개발하였는데, 설명변수들의 표본공분산 대신에 MVE-추정량을 기반으로 하였으며, 고유치가 아니라 상태지수의 크기에 바탕을 둔 선정기준을 제안하였다. 그리고 주성분모형에서의 추정을 위하여 회귀이상점에 대해 로버스트한 LTS-추정을 도입하였다. 제안된 선정기준이 기존의 기준들보다 다중공선성과 이상점이 유발하는 문제들을 잘 해결할 수 있음을 모의실험을 통하여 확인하였다.
키워드
Multicollinearity; outlier; robust principal components regression; minimum volume ellipsoid estimator; condition index; least trimmed squares estimation; 다중공선성; 회귀이상점; 로버스트주성분회귀; MVE-추정량; 상태지수; LTS-추정
- 제목
- 로버스트주성분회귀에서 최적의 주성분선정을 위한 기준
- 제목 (타언어)
- A Criterion for the Selection of Principal Components in the Robust Principal Component Regression
- 저자
- 김부용
- 발행일
- 2011-11
- 권
- 18
- 호
- 6
- 페이지
- 761 ~ 770