Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
New features
L'objectif est de créer une banque de variables sur lesquelles caler des survey_scenario français. Concrètement, il s'agit de préparer un dictionnaire associant les variables à leurs cibles et utilisé ensuite dans les
calibration_kwargs
.Pour cela, cette PR :
assets/aggregats
reforms/variables_calibration
. Il s'agit d'avoir un bon support (pour l'âge), mais aussi de permettre les calculs effectués en cas d'utilisation de la méthode logit (qui calcule l'exponentiel des valeurs des variables, qu'il faut donc diviser ainsi que l'agrégat).model/calage
(il est facile d'en rajouter d'autres en aval)tests/test_calage
(celui-ci ne tourne qu'avec une petite modification d'OF-survey-manager, implémentée dans Allow calmar with two entities openfisca-survey-manager#299)Un obstacle à des variables de calage commun concerne les différences de champs entre données initiales (France, métropole, ménages ordinaires...). Pour prendre cela en compte, l'idée est de permettre de procéder par taux de variation entre la date des données et la date de simulation (en prenant pour cible le nombre de personnes de 3 ans en 2018 dans la base initiale * la variation du nombre d'enfant de cet âge entre 2018 et 2024 dans les agrégats pour une simulation de 2024 sur données 2018 par exemple). L'hypothèse est donc que les proportions évoluent de manière similaire dans tous les champs.
Pour simplifier les mises à jour, l'idéal serait de mettre des données assez brutes dans les agrégats, pour pouvoir facilement en mettre des plus actualisées. J'ai cependant dû déjà un peu modifier les projections de population par âge, qui me sert de test.