Backtesting pour X-13ARIMA-SEATS

Nos utilisateurs nous posent de nombreuses questions sur la précision des prévisions : comment les prévisions de mon modèle se situent-elles par rapport aux valeurs réelles ? Les valeurs prévues et les valeurs réelles se suivent-elles de près ? Quel est le type d'erreur de suivi ?

La technique du backtesting répond à ces questions, avec un petit plus : si nous pouvions remonter dans le temps, nous pourrions calibrer le modèle en utilisant uniquement les données disponibles jusqu'à cette date et effectuer une prévision hors échantillon. Ensuite, nous répétons la procédure pour différentes dates.

À la fin du processus de backtesting, nous générons une série temporelle des valeurs prévues, que nous pouvons ensuite analyser par rapport à la série temporelle réelle. Nous pouvons alors calculer toutes sortes de statistiques.

Cet article a été inspiré par une demande d'assistance spécifique de l'un de nos utilisateurs :

“Comment puis-je effectuer un backtesting sur les prévisions X-13ARIMA-SEATS des valeurs corrigées des variations saisonnières et des valeurs finales (c'est-à-dire non corrigées des variations saisonnières) ?”

Pour réaliser le backtesting, nous devons exécuter plusieurs scénarios X13AS qui ne diffèrent que par l'ensemble des données d'entrée.

Pour ce tutoriel, nous utiliserons les données mensuelles sur l'emploi salarié non agricole du ministère américain du travail (DOL) entre janvier 1970 et juin 2022.

  1. À l'aide de l'assistant X13, construisez le modèle X13 en utilisant l'ensemble des données. L'assistant écrira la spécification du modèle (texte JSON) dans votre feuille de calcul à l'endroit indiqué.
    Utilisez l'assistant X13 pour construire le modèle X13. Le résultat sera la spécification de votre modèle en texte JSON.
  2. Ensuite, dans une colonne vide, dressez la liste de toutes les périodes pour lesquelles vous souhaitez établir une prévision.
    La colonne de données 'Mois' comprend toutes les périodes pour lesquelles vous souhaitez établir des prévisions.
  3. Calculer le nombre de points de données depuis le début de l'ensemble de données jusqu'à chaque période spécifiée à l'étape (2).
    Calculer les points de données depuis le début de l'ensemble de données jusqu'à la période spécifiée dans la colonne 'Mois'.
  4. Copier la formule X13AS(.) en (1) dans une colonne séparée, adjacente à la colonne de l'étape (3).
    Utilisez la formule X13 pour chacune des périodes de prévision.
  5. Remplacer la plage de cellules des données d'entrée par un appel à NxSubset(.). La fonction NxSubset prend l'ensemble des données comme premier argument, mais le décalage d'arrivée est calculé dans la colonne de l'étape (3).
    Utilisation de la fonction NxSubset (surlignée en jaune) pour sélectionner l'ensemble de données du 1er argument à l'argument 612 (F10).

    Note:

    Veuillez vous référer à la Manuel de référence NxSubset(.) pour en savoir plus.

  6. Maintenant, la fonction X13AS(.) construit un nouveau scénario en utilisant uniquement les données jusqu'à ce point.
  7. En utilisant les fonctions X13ASCOMP(.) et X13ASFORE(.), demandez la composante ou la valeur prévisionnelle pour la date de cette ligne.
    Utilisation de la fonction X13ASFORE(.) pour obtenir la valeur prévisionnelle pour la date adjacente.
  8. Utilisez la fonction intégrée d'Excel VLOOKUP(.) pour demander la valeur réelle de chaque ligne.
    Utilisation de la fonction VLOOKUP(.) pour obtenir les données réelles pour la date adjacente.
  9. Copiez les formules de la ligne supérieure dans le reste du tableau. Cette opération déclenche une série de calculs du modèle X13 et peut prendre jusqu'à une minute.
    Le tableau de sortie du backtesting X13 après avoir copié les formules sur le reste des périodes sélectionnées.
  10. Enfin, traçons les valeurs de backtesting avec les valeurs réelles.
    Un graphique montrant les valeurs des prévisions backtestées par rapport aux valeurs réelles pour les données DOL Payroll Employment de Jan-21 à Jun-2022.

Conclusion

Dans notre exemple, nous avons calculé les prévisions non saisonnières corrigées d'un mois pour les 24 derniers mois, mais nous pouvons facilement étendre la période d'étude et/ou calculer d'autres résultats.

Une fois que nous avons calculé la série temporelle de sortie du backtesting, nous devons décrire quantitativement l'erreur de suivi des prévisions à l'aide de votre mesure de performance préférée (incluse dans NumXL), telle que MAPE, RMSE, MASE, etc.

  Pièces jointes

Commentaires

Vous devez vous connecter pour laisser un commentaire.

Cet article vous a-t-il été utile ?
Utilisateurs qui ont trouvé cela utile : 0 sur 0