next up previous contents
Next: 演習例題 Up: 環境システム科学演習ーEOF解析 Previous: Contents   Contents

EOFの導出

今、海面水温偏差の時系列データ(1-N個)が、1-M個の観測点で得られる場合を考える。この観測データが示す 変動を互いに直交し相関を持たないM個の関数(モード)の線形結合として聞ことを考える。(これは、 時系列データを無数のフーリエ直交関数で聞のと類似しているが、この場合、とられる関数 の形は三角関数に限定されず、関数の形自体もデータから求めることになる。)即ち、

$\displaystyle \psi_m(t) = \sum_{i=1}^M [a_i(t)\phi_m^i].$ (1)

ここで、$ a_i(t)$ は、時刻tにおけるi番目のモードの振幅を雰、$ \phi_m^i$ 、は観測点 mにおけるi番目のモードの関数値を与える。全変動は、これらモードの総和として併るとする。 総和として併るということは、各モード間での掛け算が、それ自身との掛け算以外0になる ことを意味する。即ち、モード間での相関はなく、それ故$ \phi_m^i$ は、直交関数と呼ばれる。即ち、

$\displaystyle \sum_{m=1}^M [\phi_{im}\phi_{jm}]=\delta_{ij},$ (2)

を意味する。ここで $ \delta_{ij}$ は、クロネッカーデルタとよばれ、


\begin{displaymath}\delta_{ij}=\left\{
\begin{array}{ll}
1 & (i=j) \\
0 & (i\neq j) \\
\end{array}
\right.\end{displaymath}     (3)

を満たし、あるモード自身との掛け算は、それ以外は0である。各モードの振幅、$ a_i(t)$ もモード間で相関が無いとしなければモードの変動の総和でデータを聞ことができなくなってしまう。 即ち、

$\displaystyle \overline{a_i(t)a_j(t)}=\lambda_i\delta_{ij},$ (4)

ここで $ \overline{    }$ は、時間平均を示す。また$ \lambda_i$ は、

$\displaystyle \lambda_i=\overline{a_i(t)^2}=\frac{1}{N}\sum_{k=1}^N [a_i(t_k)^2],$ (5)

であり、時系列データ、$ \psi_m(t)$ から平均値を差し引いたものを取り扱っている場合、 $ \lambda_i$ は、偏差データの各モードにおける振幅の分散に等しい。

さて、(1)を行列を用いて聞と、以下の様に併る。

$\displaystyle \mathbf{D}=\mathbf{E}\mathbf{A}.$ (6)

即ち、 $ \mathbf{D}=\psi_m(t)$ とおき、 $ a_i(t)=\mathbf{A}$ $ \phi_m^i=\mathbf{E}$ とした。 行列の式のかたちは以下の様に聞ことができる。

$\displaystyle \left[ \begin{array}{ccccc} \psi_{11} & \psi_{12} & \psi_{13} & ....
...& :& : & ... & :  a_{M1} & a_{M2} & a_{M3} & ... & a_{MN} \end{array} \right]$ (7)

右辺の行列のかけ算によって、 $ \mathbf{E}$ のi行目と、 $ \mathbf{A}$ のj列目が要素それぞれの積の総和として求まる。このとき、 行列の次元を確認すると、 $ M \times N=M \times M M \times N$ であるので、2つの行列のかけ算 によって両者の内側の次元が消える事がわかる。また内側の次元は等しくなければならない。

今、式(6[*])の両辺に $ \mathbf{D}$ の転置行列、 $ \mathbf{D}^T$ を右から掛ける。即ち、

$\displaystyle \mathbf{D}\mathbf{D}^T=\mathbf{E}\mathbf{A}\mathbf{A}^T\mathbf{E}^T=\mathbf{E}N\lambda \mathbf{I} \mathbf{E}^T,$ (8)

ここで、

$\displaystyle \mathbf{D}^T=(\mathbf{E}\mathbf{A})^T=\mathbf{A}^T\mathbf{E}^T,$ (9)

および、$ a_i(t)$ が線形独立(それ自身以外とのかけ算が0、 $ \overline{a_i(t)a_j(t)}=\lambda_i\delta_{ij}$ の関係を用いた。

また、ここで、 $ \mathbf{A}\mathbf{A}^T$ が、式(4[*])の $ \overline{a_i(t)a_j(t)}$ にデータ数、$ N$ をかけたものに等しいため、 $ N$ を付与しなければならない。今、以下の形をとる式(8[*])の右辺 $ \lambda \mathbf{I}$ を、

$\displaystyle N\lambda \mathbf{I}= N\left[ \begin{array}{ccccc} \lambda_{11} & ...
...a_{M-1 M-1} & 0 0 & 0 & 0 & ... & \lambda_{MM} \end{array} \right]=\mathbf{L}$ (10)

$ \mathbf{L}$ と定義する。Lは対角行列であるので、 $ \mathbf{EL}=\mathbf{LE}$ が成立する。このため、

$\displaystyle \mathbf{D}\mathbf{D}^T=\mathbf{E}\mathbf{L}\mathbf{E}^T=\mathbf{L}\mathbf{E}\mathbf{E}^T,$ (11)

がなりたつ。今、式(11[*])の右からEをかけると、

$\displaystyle \underbrace{\mathbf{D}\mathbf{D}^T}_{N\mathbf{C}} \mathbf{E}=\mathbf{L}\mathbf{E}\underbrace{\mathbf{E}^T\mathbf{E}}_{\mathbf{I}} =\mathbf{LE},$ (12)

となる。( $ \mathbf{E}\mathbf{E}^T$ $ \mathbf{I}$ にはならないことに注意。)ここで、 $ \mathbf{C}$ は、 データの共分散行列である。式([*]12)を行列成分まで書くと以下の様な形になる。

$\displaystyle N\left[ \begin{array}{ccc} C_{11} & ... & C_{1M}  : & ... & : \...
.... & \phi_{1M}  : & ... & :  \phi_{M1} & ... & \phi_{MM} \end{array} \right]$ (13)

これを各観測点$ m$ について、式を書くと、

$\displaystyle \sum_{i=1}^M C_{im} \phi_{im}=\sum_{i=1}^M \lambda_i \phi_{im}$ (14)

となりこれは、固有値:$ \lambda_i$ 、固有ベクトル:$ \phi_i$ の固有値問題である。

ところで、最初の定義で、 $ \mathbf{D}=\mathbf{EA}$ でデータを線形モードの総和で 塀うとした。この式の両辺の左から $ \mathbf{E}^T$ をかけると、 $ \mathbf{E}^T\mathbf{E}=\mathbf{I}$ であるので、整理すると

$\displaystyle \mathbf{A}=\mathbf{E}^T\mathbf{D}$ (15)

となり、任意の時間、観測点における各モードの振幅は、 $ \mathbf{E}^T\mathbf{D}$ として 得られることが分かる。即ち、データの共分散を求めた後、式(12[*])の固有値問題を解いて $ \mathbf{E}$ (固有ベクトル)と $ \mathbf{L}$ (固有値)を求められるが、さらに求めた $ \mathbf{E}$ から振幅 $ \mathbf{A}$ を求められる。したがって、最初の式: $ \mathbf{D}=\mathbf{EA}$ を用いて 任意の時間、観測点における各モードの振る舞いを抽出することができる。


next up previous contents
Next: 演習例題 Up: 環境システム科学演習ーEOF解析 Previous: Contents   Contents
Takeyoshi Nagai 2011-11-29