Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Calage sur agrégats #262

Open
wants to merge 5 commits into
base: master
Choose a base branch
from
Open

Calage sur agrégats #262

wants to merge 5 commits into from

Conversation

sylvainipp
Copy link
Contributor

@sylvainipp sylvainipp commented Aug 27, 2024

New features

L'objectif est de créer une banque de variables sur lesquelles caler des survey_scenario français. Concrètement, il s'agit de préparer un dictionnaire associant les variables à leurs cibles et utilisé ensuite dans les calibration_kwargs.

Pour cela, cette PR :

  • Récupère des agrégats dans assets/aggregats
  • Crée certaines variables spécifiques au calage dans reforms/variables_calibration. Il s'agit d'avoir un bon support (pour l'âge), mais aussi de permettre les calculs effectués en cas d'utilisation de la méthode logit (qui calcule l'exponentiel des valeurs des variables, qu'il faut donc diviser ainsi que l'agrégat).
  • Crée une fonction permettant de choisir les variables à caler parmi celles implémentées dans model/calage (il est facile d'en rajouter d'autres en aval)
  • Crée un test concernant ce calage dans tests/test_calage (celui-ci ne tourne qu'avec une petite modification d'OF-survey-manager, implémentée dans Allow calmar with two entities  openfisca-survey-manager#299)

Un obstacle à des variables de calage commun concerne les différences de champs entre données initiales (France, métropole, ménages ordinaires...). Pour prendre cela en compte, l'idée est de permettre de procéder par taux de variation entre la date des données et la date de simulation (en prenant pour cible le nombre de personnes de 3 ans en 2018 dans la base initiale * la variation du nombre d'enfant de cet âge entre 2018 et 2024 dans les agrégats pour une simulation de 2024 sur données 2018 par exemple). L'hypothèse est donc que les proportions évoluent de manière similaire dans tous les champs.

Pour simplifier les mises à jour, l'idéal serait de mettre des données assez brutes dans les agrégats, pour pouvoir facilement en mettre des plus actualisées. J'ai cependant dû déjà un peu modifier les projections de population par âge, qui me sert de test.

@sylvainipp sylvainipp changed the title Calage sur agrégat Calage sur agrégats Sep 9, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

1 participant