时间序列中的不确定性:在椭圆集中的共形预测时间序列中的不确定性:在椭圆集中的共形预测
在现代机器学习的浪潮中,共形预测(Conformal Prediction,CP)作为一种无分布假设、模型无关且理论基础扎实的方法,越来越受到研究者的青睐。尤其是在不确定性量化的场景中,CP不仅能提供点估计,还能构建包含未观察到的真实值的置信区域。尽管CP在单变量输出方面取得了显著成功,但在多维时间序列预测中,其应用仍显得相对薄弱。本文将介绍一种新的CP方法——MultiDimSPCI,专门针对多维响应的预测区域构建,尤其是在多维时间序列的背景下。 引言:共形预测的魅力 共形预测的基本思路是利用一个黑箱模型 $f$ 和输入特征 $X$,构建一个非一致性评分(non-conformity score),该评分衡量了潜在输出与历史数据的不一致程度。这个不一致性评分可以理解为一种“异常检测”机制,帮助我们判断一个新的观测值是否符合历史数据的模式。 在经典的CP方法中,通常假设数据是可交换的,即数据点之间没有顺序关系。然而,在多维时间序列中,数据的顺序往往是至关重要的。换句话说,时间序列数据具有内在的时间依赖性和复杂的维度间相关性,这使得基于CP的传统模型在处理多维输出时显得力不从心。 MultiDimSPCI:应对复杂的多维时间序列 本文提出的MultiDimSPCI方法,致力于在不假设数据交换性的情况下,构建适应性强的椭圆预测区域。具体来说,MultiDimSPCI方法通过以下几个步骤来实现其目标: 理论分析:覆盖率保证 在理论层面,MultiDimSPCI为构建的预测区域提供了有限样本高概率界限,确保覆盖率不依赖于观测的交换性。我们证明: $$|P(Y_{t+1} \in C_{\alpha}(X_{t+1}) | X_{t+1} = x_{t+1}) – (1 – \alpha)| \leq C_1 \cdot r \cdot \sqrt{\frac{\log [...]