Dans ce document, nous analyserons la série de données sur les passagers internationaux (G), comme indiqué dans le manuel Time Series : Forecast and Control de Box, Jenkins et Reinsel (ISBN : 978-0470272848). Ce manuel a été publié pour la première fois à la fin des années 1960 et est considéré par de nombreux praticiens comme le manuel de base définitif sur le thème des séries temporelles.
La série sur les passagers des compagnies aériennes internationales décrit les totaux mensuels des passagers internationaux pour la période allant de janvier 1949 à décembre 1960.
L'objectif est ici de suivre la même analyse que dans le livre et de démontrer la précision des calculs de NumXL. En outre, SAS - un éditeur de logiciels statistiques de premier plan - présente sa propre analyse pour le même ensemble de données. Nous recommandons donc vivement à nos utilisateurs d'examiner également leurs résultats, via ce lien :
SAS Procedural reference - Example 7.2 Modèle saisonnier pour la série des compagnies aériennes
步骤 1:数据转换
À l'aide de l'assistant de statistiques descriptives (illustré ci-dessous), examinez les différentes statistiques récapitulatives des données de l'échantillon.
Dans le tableau des statistiques récapitulatives (illustré ci-dessous), la série de données présente une corrélation sérielle (c'est-à-dire qu'elle a échoué au test du bruit blanc) et des queues grasses (excès d'aplatissement significatif et effet ARCH).
L'analyse originale convertit les séries de données en utilisant la fonction de logarithme naturel (LN). Suivez la même technique, comme le montre le graphique ci-dessous :
Cette technique devrait permettre d'obtenir les statistiques sommaires suivantes :
Remarquez que la série de données transformées est plus lisse que les données originales et que la tendance temporelle semble plus linéaire que les données originales.
Étape 2 : Analyse des corrélogrammes
En utilisant la barre d'outils NumXL, lancez l'assistant Corrélogramme.
Mettez en surbrillance les données du journal et sélectionnez 24 retards pour ACF et PACF. Créez ensuite un corrélogramme pour les données.
En examinant le graphique ACF, les données semblent être intégrées à un décalage de un (1) et à un décalage de douze (12). Différenciez les données pour les deux décalages (c'est-à-dire $ \left(1-L\right)\left(1-L^{12}\right) $), comme le montre le graphique ci-dessous :
L'ensemble des données différentiées devrait générer le corrélogramme suivant :
Remarquez également que l'ACF de la série de données différenciées montre une autocorrélation significative au lag un (1) et au lag douze (12).
Étape 3 : Modélisation des compagnies aériennes
Le modèle proposé pour la série de données logarithmiques sur les passagers est un modèle de compagnie aérienne avec une saison de 12 mois.
$$\left(1-L\right)\left(1-l^{12}\right)\ln{X_t}=\mu \left(1+\theta L\right)\left(1+\Theta L^{12}\right)a_t$$
Où
- L = l'opérateur de décalage arrière (alias B).
- $a_t$ = le terme d'erreur, le choc, l'innovation ou simplement le résidu du modèle au temps t.
- $\mu$ = la moyenne de la série temporelle en différences saisonnières.
Dans la barre d'outils NumXL, cliquez sur l'icône Airline pour lancer l'assistant de modèle Airline.
Étape 4 : Étalonnage
Sélectionnez la cellule en haut du tableau du modèle de compagnie aérienne (c'est-à-dire "AIRLINE(12)") et cliquez sur l'icône Calibration dans la barre d'outils.
Le solveur Excel tentera de déterminer les valeurs optimales pour les paramètres du modèle de compagnie aérienne (c'est-à-dire $\theta,\Theta$ ).
Les nouvelles valeurs optimales des paramètres du modèle sont indiquées ci-dessous :
L'examen du tableau d'analyse des résidus montre que les valeurs calibrées satisfont à toutes les hypothèses du modèle sous-jacent (c'est-à-dire que les résidus sont distribués de façon gaussienne).
Les valeurs des paramètres du modèle calibré sur le site web du SAS sont légèrement différentes de celles que nous avons calculées précédemment :
Toutefois, nos valeurs se situent dans les limites de tolérance de l'erreur (c'est-à-dire ) et notre critère d'information d'Akaike (AIC) est meilleur.
La différence essentielle entre les valeurs NumXL et SAS - selon nous - peut être expliquée en notant que nous n'avons pas fixé la valeur de l'ordonnée à l'origine ($\mu$) à zéro.
Étape 5 : Prévisions
Les résidus du modèle calibré satisfont aux hypothèses d'un modèle de compagnie aérienne. Nous sommes maintenant prêts à effectuer une prévision à 24 mois pour les totaux mensuels de passagers des compagnies aériennes internationales.
Les prévisions se dérouleront en deux temps :
- Prévisions pour le logarithme des totaux mensuels
- Transformer les prévisions en totaux mensuels réguliers
Sélectionnez la cellule intitulée "AIRLINE(12)" et cliquez sur l'icône Prévision dans la barre d'outils.
Veuillez noter que, pour les besoins des prévisions, la série chronologique utilisée correspond aux 13 derniers mois, soit les observations enregistrées entre novembre 1959 et décembre 1960. Le tableau des résultats est présenté ci-dessous :
Pour revenir à des totaux mensuels réguliers, utilisez les équations suivantes :
$$UL=e^{UL_{log}}$$
$$LL=e^{LL_{log}}$$
$$\mu=e^{\mu_{log}+\frac{\sigma_{log}^2}{2}}$$
Commentaires
Vous devez vous connecter pour laisser un commentaire.