推荐系统用户反馈延迟新解法！阿里提出CVR无偏估计算法

智源社区3年前 (2023)发布智源社区

757 0 0

延迟反馈是流式样本中的典型问题，理想状态当然是使采样的窗口足够大，但是这会导致很高的存储成本，不是很划算。因此早期针对延迟反馈问题，一般都会引入一个模型预测转化的延迟时间进而利用延迟转化的样本，但是在业界的流式架构中很难避免这个预测转化时间的模型使用无偏样本训练，并且延迟的样本比较稀疏，较难有较高的精度。

现在针对延迟反馈问题，通常聚焦在如何充分利用正样本上。延迟反馈的样本在不同的采样窗口中会分别生成不同label的样本，这两条样本都会参与训练，这会导致训练样本的分布与真实样本分布存在bias，需要使用重要性采样对延迟反馈的样本进行纠偏，尽管这种方式在很多场景下都是有效的，但是这种方式不能解决假负样本也参与训练的问题，可能会影响模型精度。阿里这篇文章通过矫正重要性采样中不同样本的权重优化了延迟反馈问题，在公开数据集以及工业界的数据集上都取得了较好的效果。

论文标题：

Asymptotically Unbiased Estimation for Delayed Feedback Modeling via Label Correction

论文链接：

https://arxiv.org/pdf/2202.06472.pdf