Mercerの定理
Key word
- 統計: カーネルトリック,SVM,PCA
- 数学: スペクトル理論,Karhunen-Loeve展開
- 関連:
導入
積分核として積分作用素を定めたり,内積を与えたりする2変数関数(kernel)の展開についての定理を簡単に紹介します.
Hilbert Schmidtの理論から$L^2$展開できますが,連続性や半正定値性から一様収束が導かれるのがポイントです.
Mercer kernel
以下の3つの性質を満たすkernelをMercer kernelという.
- 連続性
- 対称性
- 半正定値性
Mercerの定理
Mercer kernel $ K $に対して$ x \mapsto K(x,x) $が$ L^1 $となるとき
\[K(x,y) = \sum_{n} \lambda_n \psi_n(x) \psi_n(y)\]と絶対一様展開できる.
証明
定理の応用
カーネルトリック
機械学習のSVMでよく使われるカーネル1はMercer kernelの条件を満たすので高次元特徴空間でのデータの内積をカーネルで置き換えることができ, これによって計算量をそれほど増やすことなく特徴空間を高次元への拡張が可能となります.
その他
- Karhunen-Loeve展開の収束を示す際に使います.
- また,離散的なKarhunen-Loeve展開としてPCAを解釈できます.
参考
pdfリンクにあります.
注意
-
多項式カーネルやガウシアンカーネル,シグモイドカーネルなど. ↩