全局的模型无关解释方法合集

这几个看的比较糙，就写到一起了。

Functional Decomposition 函数分解

把模型做因式分解

\[f(x1, x2, x3) = f(0) + f(x1) + f(x2) + f(x3) + f(x1, x2) + f(x1, x3) + f(x2, x3) + f(x1, x2, x3)\]

尽量拆解变量之间的关系，进行简化。方案比较理想。

删除一个特征，看模型预测值的变化，来衡量特征重要性用训练集还是测试集实验呢？测试集

优点

缺点

描述：训练一个可解释的模型去拟合原模型，通过解释「可解释模型」来解释原模型。看法：在原模型不可变的情况下比较适用。比如线上模型出故障了排查原因、线上模型由于各种原因不能修改。

描述：挑选原数据集中具有代表性的点（Prototypes），再挑选Prototypes 代表的不好的点Criticisms，利用这些代表点来解释模型，看是否被模型正确判定。看法：

参考：https://christophm.github.io/interpretable-ml-book/global-methods.html