需要的假设

一般来说,回归中没有潜在结果这个概念,因为回归模型估计的是响应变量的条件预期。但是,在条件可交换性和一致性的关键假设下:

$$ E \Biggl( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(\ast)} \right\}\right) } \Big| \bigl\{z_{g,t,i}\bigr\} \Biggr) = E \Biggl( \overset \sim Y_{g,t} \Big| \bigl\{z_{g,t,i}\bigr\}, \big\{x_{g,t,i}^{(\ast)}\bigr\} \Biggr) $$

关键假设

  • 条件可交换性:

    \( \overset \sim Y_{g,t}^{(\{ x_{g,t,i}^{(\ast)} \})} \) 与任何反事实情景 \(\bigl\{ x_{g,t,i}^{(\ast)} \bigr\}\) 的随机变量 \(\bigl\{ X_{g,t,i}^{(\ast)} \bigr\}\) 无关。因此,潜在结果集有条件地独立于广告客户的历史媒体执行决策。

  • 一致性:

    当 \(\bigl\{ X_{g,t,i}^{(\ast)} \bigr\} = \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}\)时,\( \overset \sim Y_{g,t} = \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) } \)。因此,观测到的 KPI 实现了与广告客户历史媒体执行情况相匹配的反事实情景的潜在结果。

根据这些假设,就会得出前面所说的结果:

$$ E \Biggl( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{\ast} \right\}\right) } \Big| \bigl\{ z_{g,t,i} \bigr\} \Biggr) \overset{\text{exchangeability}}{=} E \Biggl( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{\ast} \right\}\right) } \Big| \bigl\{ z_{g,t,i} \bigr\},\ \bigl\{ x_{g,t,i}^{(\ast)} \bigr\} \Biggr) \overset{\text{consistency}}{=} E \Biggl( \overset \sim Y_{g,t}\ \Big| \bigl\{ z_{g,t,i} \bigr\},\ \bigl\{ x_{g,t,i}^{(\ast)} \bigr\} \Biggr) $$

一致性假设相当直观,除非反事实定义不清或未在数据中准确体现,否则该假设成立。如需了解详情,请参阅 Hernan MA、Robins JM,(2020 年)Causal Inference: What If

条件可交换性假设就不那么直观了。如果所有混杂变量都获测量并包含在控制变量数组 \(\{z_{g,t,i}\}\) 中,则此假设成立。混杂变量是指对观测到的实验组 \(\{x_{g,t,i}\}\) 和结果组 \(\{\overset \sim y_{g,t}\}\) 都有因果效应的任何变量。对实验组的因果效应可以是广告客户整体预算水平的效应,也可以是跨渠道分配、跨地理位置分配或跨时间段分配的效应。在实践中,我们很难知道是否所有的混杂变量都得到了测量,因为这纯粹是一种假设,而且没有统计检验方法可以根据数据确定这一点。不过,如果假设因果图符合一个被称为“后门标准”(Pearl, J.,2009 年)的条件,那么条件可交换性假设就会成立,意识到这一点非常有帮助。如需了解详情,请参阅因果图