シミュレーションと観測の比較

数値シミュレーションと観測の結果の比較なんてよくやる。あるグリッドでシミュレーションが \(C_i\) と言って観測が \(O_i\) と言ってたりするとその「差」を計る統計量を

\[\Sigma^n_{i=1}\frac{(O_i−C_i)^2}{s_i^2} \]

なんて書きたくなる。\(s_i\) は適当な分散量。この統計量は自由度 \(n\) のカイ二乗分布になりそうだがそうでないという注意。もともとは Brooker et al. (2016) PDF! の主張。

もし \(C_i\) が \(O_i\) の不偏推定量になっていて、\(s_i\) が \(O_i\) の分散だったらカイ二乗分布になる。でもそうでないでしょって言われてみればその通り。ではどうなるかというと形状パラメタ \(a = n/2\) で尺度パラメタ

\[ b=\frac{1}{n}\Sigma∑\frac{\sigma_O^2 + \sigma_C^2 − Cov}{s_i^2} \]

のガンマ分布になる。Cov は O と C の相関。\(b=2\) とするとカイ二乗分布。これは時間 b に一回くらいおこる事象が a 回おこるまでの時間の分布とも解釈出来るそうな。