판매 예측 예시 - 모델 비교 및 선택

이 논문에서는 계량경제학 기법을 적용하여 회사 X의 영업 인력에 대한 6개월 예측을 작성합니다. 샘플 데이터로 지난 25개월 동안의 월별 총 매출 수치를 사용합니다.

우리의 목표는 경쟁 모델을 비교하고 최상의 모델을 선택하기 위한 가이드라인을 정의하는 것입니다.

이 그림은 과거 월별 총 판매량 추이를 보여줍니다.

1단계: 요약 통계

설명 통계 마법사(아래 그림)를 사용하여 샘플 데이터에 대한 다양한 요약 통계를 검토합니다.

이 그림은 판매 데이터 샘플에 대한 요약 통계 대화 상자를 보여줍니다.

요약 통계 표(아래 그림)에서 데이터 계열은 직렬 상관관계(즉, 백색 잡음 테스트에 실패)와 팻테일(유의미한 초과 첨도 및 ARCH 효과)을 나타냅니다.

이 그림은 월별 판매량 샘플에 대한 요약 통계 출력 표를 보여줍니다.

2단계: 상관관계 분석

NumXL 툴바를 사용하여 상관도 마법사를 시작합니다.

이 그림은 상관관계 대화 상자 또는 사용자 양식을 보여줍니다.

로그 데이터를 강조 표시하고 ACF 및 PACF에 대해 9개의 지연을 선택합니다. 그런 다음 데이터에 대한 상관도를 만듭니다.

이 그림은 ACF 및 PACF 출력 테이블 - 상관도 출력을 보여줍니다.

이 그림은 신뢰 구간 한계가 있는 ACF 및 PACF 플롯을 보여줍니다.

ACF 및 PACF 플롯을 살펴보면, 데이터는 AR 차수가 1(1), MA 차수가 2(2)인 ARMA 프로세스에서 구동되는 것으로 보입니다. 데이터 샘플이 상대적으로 작으므로 고차 모형으로 데이터를 과도하게 맞추지 않도록 주의해야 합니다.

3단계: ARMA 모델링

ACF/PACF 플롯을 기반으로 데이터에 대한 ARMA 모델을 제안할 수 있습니다. 또한 AR 또는 MA 순서는 2보다 작거나 같아야 합니다.

$$\left(1-\sum_{i=1}^p{\phi_i L^i}\right)\left(x_t-\mu\right)=\left(1+\sum_{j=1}^q{\theta_j L^j}\right)a_t$$

장소:

  • $L$ = 지연 또는 백시프트 연산자
  • $\phi_i$ = AR 컴포넌트의 i 번째 계수입니다.
  • $p$ = 자동 회귀(AR) 구성 요소의 순서를 지정합니다.
  • $x_t$ = 월의 월별 총 매출 $t$
  • $\mu$ = 의 장기 평균을 구합니다.
  • $\theta_j$ = MA 구성 요소의 j-th 계수
  • $q$ = 이동평균(MA) 구성 요소의 순서
  • $a_t$ = 월의 잔여, 충격, 혁신 또는 오류 기간 $t$.

이 섹션에서는 무차별 대입 방식을 사용하여 가능한 모든 ARMA 모델 순열을 살펴봅니다. 요약하면, 각 모델을 지정, 보정, 검증하고 마지막으로 각 모델을 다른 모델과 비교하여 가장 적합하고 가장 간단한 모델을 결정합니다.

3.1단계: 모델 사양

이 그림은 ARMA 마법사 또는 대화 상자를 사용한 ARMA 모델 사양을 보여줍니다.

이 그림은 모델 매개변수, 적합도 및 잔차 진단을 위한 ARMA 모델 출력 표를 보여줍니다.

3.2단계: 모델 보정

항공사 모델 표 상단의 셀(예: "ARMA(1,2)")을 선택하고 도구 모음에서 보정 아이콘을 클릭합니다.

이 그림은 NumXL 바로 가기를 사용하여 Excel 솔버를 초기화하는 ARMA 캘리브레이션을 보여줍니다.

3.3단계: 보정된 모델 검토 및 유효성 검사

위의 ARMA(2.1) 모델의 경우, 모델 파라미터의 새로운 최적값은 아래와 같습니다:

이 그림에서는 모델 가정에 대한 보정 후 ARMA(2,1) 잔차를 살펴보고 있습니다.

3.4단계: 모델 비교 및 최적의 모델 선택

첨부된 스프레드시트에서 (1,0) ~ (2,2) 순서의 모든 ARMA 모델에 대해 이전 단계(3.1-3.3)를 반복했습니다. 다음 표에는 그 결과가 요약되어 있습니다:

이 그림은 다양한 경쟁 모델의 적합도 요약 표를 보여줍니다.

Akaike의 정보 기준(AIC)의 계산은 모델의 복잡성을 고려하며, 자유 인수의 수가 증가할수록 적합도에 불이익을 줍니다. 서로 다른 모델을 비교하기 위해 AIC 측정값을 사용합니다.

모든 모델의 AIC가 비교적 비슷하지만, 가장 간단한 방법을 선호하여 ARMA(1,0) 또는 AR(1)을 선택했습니다.

이 그림은 가장 잘 선택된 모델인 ARMA(1,0)/AR(1) 최적 모델의 파라미터를 보여줍니다.

이 그림은 AR(1) 모델 적합 데이터를 원본 샘플과 함께 그래프로 표시한 것입니다.

4단계: 예측

선택한 보정된 모델의 잔차는 ARMA 모델의 가정을 충족합니다. 이제 월별 총 매출에 대한 6개월 예측을 수행할 준비가 되었습니다.

"ARMA(1,0)"이라고 표시된 셀을 선택하고 도구 모음에서 예측 아이콘을 클릭합니다.

이 그림은 NumXL 예보 대화 상자 또는 마법사를 사용한 예보를 보여줍니다.

참고로, 예측 목적으로 입력 시간 시리즈는 최신 판매 총액(즉, 전월)을 의미합니다. 출력 표는 아래에 표시되어 있습니다:

이 그림은 월별 판매 총액에 대한 예상 출력 테이블을 보여줍니다.

참고: 예측 값은 시간이 지남에 따라 모델의 장기 평균인 50.65 ($\phi_o$)로 점차 이동하고 있으며, 예측 오차는 1.8에 접근하고 있습니다. 이는 모델의 조건부(즉, 무조건적) 장기 표준 편차입니다.

마지막으로 아래와 같이 향후 9~12개월 동안의 예측 평균과 신뢰 구간을 플롯합니다:

이 그림은 신뢰 구간 제한 또는 지역이 포함된 매출 예측 플롯을 보여줍니다.

결론

이제 샘플 데이터에 가장 적합한 ARMA(1,0) 또는 AR(1) 모델을 선택하여 그 표현의 실질적인 의미를 살펴봅니다. 이 모델은 연속된 달 사이의 매출 수치에 유의미한 상관관계가 있음을 나타냅니다.

또한, 판매 건 중 약 45%(X사가 수주한 건)가 2개월 주기로 마감되는 것으로 나타났습니다:

$$ r = \frac{\phi_1}{1+\phi_1}=\frac{0.82}{1.82}=45\% $$

지원 파일

댓글

댓글을 남기려면 로그인하세요.

도움이 되었습니까?
0명 중 0명이 도움이 되었다고 했습니다.