機械学習でカーネルについて話すとき、最初に思い浮かぶのはサポート ベクトル マシン (SVM) モデルでしょう。
カーネルとは何か、なぜそれが重要なのかを理解していただくために、まず SVM モデルの基本を紹介します。
SVM モデルは教師あり機械学習モデルで、主に分類に使用されます (ただし回帰にも使用できます!)。 決定境界を形成することによって、異なるグループを分離する方法を学習します。
上のグラフで、観測のクラスは2つあると気付きました。 青いポイントと紫のポイントです。 左のグラフに示すように、これらの 2 つのクラスを分離する方法はたくさんあります。 しかし、我々は、この2つのクラス間のマージンを最大化できる「最良の」超平面を見つけたいのです。これは、超平面と両側の最も近いデータ点との間の距離が最大であることを意味します。 新しいデータ点が超平面のどちらの側に位置するかによって、新しい観測にクラスを割り当てることができます。
上記の例では、単純に聞こえます。 しかし、すべてのデータが直線的に分離可能なわけではありません。 実際、現実の世界では、ほとんどすべてのデータはランダムに分布しており、異なるクラスを線形に分離することは困難です。