Hypothèses requises

En général, il n'existe pas de concept de résultats potentiels pour la régression, car les modèles de régression estiment les attentes conditionnelles d'une variable de réponse. Toutefois, selon les hypothèses clés d'échangeabilité conditionnelle et de cohérence :

$$ E \Biggl( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(\ast)} \right\}\right) } \Big| \bigl\{z_{g,t,i}\bigr\} \Biggr) = E \Biggl( \overset \sim Y_{g,t} \Big| \bigl\{z_{g,t,i}\bigr\}, \big\{x_{g,t,i}^{(\ast)}\bigr\} \Biggr) $$

Hypothèses clés

  • Échangeabilité conditionnelle :

    \( \overset \sim Y_{g,t}^{(\{ x_{g,t,i}^{(\ast)} \})} \) est indépendant des variables aléatoires \(\bigl\{ X_{g,t,i}^{(\ast)} \bigr\}\) pour tout scénario contrefactuel \(\bigl\{ x_{g,t,i}^{(\ast)} \bigr\}\). L'ensemble des résultats potentiels est donc conditionnellement indépendant de la décision historique d'exécution média de l'annonceur.

  • Cohérence :

    \( \overset \sim Y_{g,t} = \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) } \) lorsque \(\bigl\{ X_{g,t,i}^{(\ast)} \bigr\} = \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}\). Le KPI observé du résultat potentiel pour le scénario contrefactuel équivaut à l'historique d'exécution média de l'annonceur.

En partant de ces hypothèses, vous obtenez le résultat indiqué précédemment :

$$ E \Biggl( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{\ast} \right\}\right) } \Big| \bigl\{ z_{g,t,i} \bigr\} \Biggr) \overset{\text{exchangeability}}{=} E \Biggl( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{\ast} \right\}\right) } \Big| \bigl\{ z_{g,t,i} \bigr\},\ \bigl\{ x_{g,t,i}^{(\ast)} \bigr\} \Biggr) \overset{\text{consistency}}{=} E \Biggl( \overset \sim Y_{g,t}\ \Big| \bigl\{ z_{g,t,i} \bigr\},\ \bigl\{ x_{g,t,i}^{(\ast)} \bigr\} \Biggr) $$

L'hypothèse de cohérence est assez intuitive. Elle est valable sauf si le contrefactuel est mal défini ou n'est pas représenté avec précision dans les données. Pour en savoir plus, reportez-vous à Causal Inference: What If, Hernan MA, Robins JM, (2020).

L'hypothèse d'échangeabilité conditionnelle est un peu moins intuitive. Elle est valable si toutes les variables de confusion sont mesurées et incluses dans le tableau de contrôle \(\{z_{g,t,i}\}\). Les variables de confusion sont des éléments qui ont un effet de causalité sur le traitement observé \(\{x_{g,t,i}\}\) et le résultat \(\{\overset \sim y_{g,t}\}\). Un effet de causalité sur le traitement peut correspondre à un effet du niveau de budget global de l'annonceur, ou de la répartition entre les canaux, les zones géographiques ou les périodes. En pratique, il est difficile de savoir si toutes les variables de confusion sont mesurées, car il s'agit d'une hypothèse pure et simple, et il n'existe aucun test statistique permettant de le déterminer à partir de vos données. Toutefois, il peut être utile de savoir que l'hypothèse d'échangeabilité conditionnelle est valable si vous supposez qu'un diagramme causal répond à une condition appelée critère backdoor (Pearl J., 2009). Pour en savoir plus, consultez Diagramme causal.