이번 이슈는 비모수 데이터 맞춤 함수 중 두 가지에 대한 고객의 문의에서 영감을 받았습니다: NxLOCREG(.)와 NxKREG(.). 고객이 이렇게 썼습니다:
문의 1:
"NxLOCREG 및 NxKREG 함수를 이해하는 데 도움이 필요합니다.
- NxLOCREG 및 NxKREG의 경우 - Y가 100개 데이터 포인트이고 Alpha = 0.333이면 알고리즘이 마지막 33개 데이터 포인트를 보고 있다는 의미인가요, 아니면 3번째 포인트마다 분포를 보고 있다는 의미인가요?
- 다항식 차수 3(큐빅)까지만 사용할 수 있습니다. 그 이상은 #NUM으로 반환됩니다! 알고리즘에서 더 높은 순서를 허용하나요?
- NxLOCREG와 NxKREG의 차이점이 모호합니다. 간단히 설명해 주시겠어요?"
NxLOCREG(.) 함수는 사비츠키-골레이 필터라고도 하는 지역화된 회귀 알고리즘인 LOESS를 구현합니다.
NxKREG(.) 함수는 가중 최소제곱 회귀를 구현합니다.
두 함수는 매우 유사하지만 NxLOCREG(.)에는 추가 인수가 있습니다: 0(제외)에서 1(포함) 사이의 값을 취할 수 있는 알파 또는 H입니다. 따라서 NxLOCREG 함수는 가장 가까운 H*N 데이터 요소를 선택하는 반면, NxKREG(.)는 항상 전체 데이터 집합(즉, N)을 포함합니다.
목표 값 X가 주어지면 커널 회귀 절차는 다음과 같이 진행됩니다:
- 목표 값과 샘플의 데이터 포인트 사이의 거리를 계산합니다.
- 거리를 기준으로 데이터 요소를 오름차순으로 정렬합니다.
- 회귀 입력 데이터 세트를 선택합니다:
- (NxLOCREG의 경우) 가장 가까운(즉, 첫 번째) H*N 데이터 요소를 선택합니다.
- (NxKREG의 경우) 전체 N개의 데이터 요소를 선택합니다.
- 주어진 커널 함수를 사용하여 선택한 데이터 포인트의 가중치를 계산합니다.
- 가중 최소자승 회귀 모델을 수행합니다.
- 값 X에서 회귀 값을 계산합니다.
절차/알고리즘은 목표 값에 가장 가까운 H*N 데이터 포인트를 사용하므로 모든 값은 (아마도) 다른 데이터 집합으로 자체 회귀 모델을 구성하게 됩니다.
다른 모든 인수를 동일하게 유지한 상태에서 Alpha = 1.0인 경우, NxKREG(.) 및 NxLOCREG(.) 함수는 동일한 결과를 반환합니다.
현재 NxLOCREG(.) 및 NxKREG(.) 함수는 최대 3차(큐빅) 차수의 다항식을 지원합니다.
선택한 가중치 커널 함수에 관계없이 대역폭(일명 평활화 매개변수)에 대한 값이 필요합니다. NumXL은 데이터 기반 대역폭 선택 방법을 사용하여 교차 검증을 위한 RMSE를 최소화합니다.
간단히 말해, 주어진 대역폭에 대해 각 데이터 포인트에 대한 회귀값을 계산하고(leave-one-out 교차 검증 사용) 회귀값과 실제 값 사이의 RMSE를 계산합니다.
문의 2:
"따라서 데이터에 스파이크가 있는 경우, 스파이크의 일부 지점이 회귀 데이터 집합에 없을 수 있습니다."
이는 "스파이크"를 어떻게 정의하느냐에 따라 달라집니다. 스파이크가 이상값(큰 Y 값)에 대한 참조인 경우, 이 방법에는 이상값이 있는 데이터 포인트가 포함됩니다. 하지만 이러한 데이터 포인트는 목표 값과의 유클리드 거리에 따라 가중치가 낮아질 수 있습니다.
반면에 스파이크가 X-도메인을 따라 원격 데이터 포인트에 대한 참조인 경우, 해당 원격 데이터 포인트는 회귀에서 가중치가 크게 낮아집니다.
문의 3:
"Excel의 표준 분산형 차트 평활화는 LOESS 함수에 의존하는 것 같습니다. 중간 값을 수동으로 계산하려는 경우 이 국소화된 평활화를 생성하는 Excel의 기본 함수는 어떤 방식인가요?"
예, Microsoft Excel은 LOESS 알고리즘을 사용하여 분산형 차트에서 평활선을 생성하는 것으로 알고 있습니다. 하지만 커널 함수, 다항식 순서 또는 알파 값과 같이 사용되는 매개 변수 값을 확신할 수 없습니다.
모든 기능을 갖춘 무료 다운로드 14일 평가판 을 사용하여 이러한 기능을 테스트하거나 자신의 데이터에 적용할 수 있습니다.
자세한 내용은 팁 및 유용한 정보 그리고 데이터 피팅 섹션에서 관심을 가질 만한 더 많은 기사를 확인하세요.
댓글
댓글을 남기려면 로그인하세요.