観察データからの最適治療政策の学習
Adaptive welfare maximization
本研究は、観察データから最適な治療政策を学習する問題に取り組んでいます。この問題は、個別の治療効果を最大化するための政策決定において重要です。著者らは、豊富な共変量と未知の傾向スコアに対応するために、二重ロバストな福祉推定とサンプル分割を組み合わせたアルゴリズムを提案しています。具体的には、提案手法は、適切な政策の複雑さを選択しながら、期待される後悔の最小化においてミニマックス最適な収束率を達成することが示されています。データ生成過程や第一段階の非パラメトリック推定器に対する不必要に制約的な仮定を避けつつ、関連する普遍的な定数の明確な特性を導出しています。提案手法の実用的な性能は、シミュレーション研究によって実証されています。