流速データ \(u_i\) を平均して eddy kinetic energy を求めたい。EKE はいはば「母分散」なので \(U=\Sigma u_i / N\) で平均を求めて \(\Sigma (u_i - U)^2/ (N-1)\) と。ここまで自由度の話は関係ない。
かようにしてもとめた\(U\) に如何ほどの誤差があるのか。Davis (1991)(これ J.L.Reid 特集号だったのか)によればその「分散」は \(2\kappa (1 + (N-1)\lambda^2 /(NA))/(NL)\)となる(4.7)。ここに κ は水平拡散で、 λ は長さスケールで A は領域面積、 L が観測時間となる。時間的な自由度(有効サンプル数)は \(n_T = L/T\)、空間的な自由度は \(n_A = A/\lambda^2\) なのでテイラーの水平拡散 \(2\kappa = \langle u^2 \rangle T\) を用いてこれは \(\langle u^2 \rangle (1 + 1/n_A)/n_T\) となる。N は大きいとした。これは自由度が増えると小さくなって「良い」観測になる。
では、EKE の誤差をどう考えるか。速度が正規分布している(厳密には表層ではよさげだがある程度深くなると嘘。「尾」が多いので誤差は過小評価になりそう)とすると、\((n-1) s^2/ \sigma^2\) (σ は真の母分散、\(s^2 = \Sigma (u_i - U)^2/(n-1)\) が自由度 (n-1) の \(\chi^2\) 分布。n はサンプルの自由度。ここから相対誤差が出る。
モンテカルロで EKE を調べるときは、\(\sigma^2 = (n-1)s^2/\chi^2\) と変形してサンプリングすればよさげ。重複サンプリングがあるときはサンプル数と n が一致しないが、s2 を標本分散推定値(つまり標本分散総和を標本数で割ったもの。自由度ではない)とすれば DoF=n-1 で行けそう。
重複サンプリングでも s2 を標本分散推定値とするココロは以下の通り。まず、重複サンプリングしても平均が大丈夫なのは
\[ E((u_1+u_2+ \cdots +u_N)/N) = E((u_1+u_2+ \cdots +u_N+u_K)/(N+1)) \]
から分かる。サンプル K がダブった。同様に
\[ E(((u_1-U)2+(u_2-U)2+ \cdots +(u_N-U)2)/N) = E((u_1^2+u_2^2+ \cdots +u_N^2)/N)-E(U^2) \]
に気を付けて、
\[ E(((u_1-U)^2+(u_2-U)^2+ \cdots +(u_N-U)^2+(u_K-U)^2)/(N+1) = E((u_1^2+u_2^2+ \cdots +u_N^2+u_K^2)/(N+1))-E((u_1+u_2+ \cdots +u_N+u_K)/(N+1))^2) = m^2 - (m^2/(N+1) + \mu^2 N/(N+1)) = \sigma^2 N/(N+1) \]。
ここに \(m^2\) は二次のモーメントで μ は母平均。