Support Vector Machine

��

�� $m$ �� $n$-�� $\Bbb{R}^n$: $$ x_1, x_2, \dots, x_m \in \Bbb{R}^n. $$ �� , �� (features). �� , �� . �� , �� , � �� .

�� , �� : ��, �� , �� $1$, �� — �� $-1$. �� $y_i$: �� $(x_i, y_i)$ �� , �� $y_i = 1$, �� $y_i = -1$.

�� — �� 1, �� : $$ \langle w, x\rangle - b = 0, \quad w\in \Bbb{R}^n, \quad x\in \Bbb{R}^n, \quad b\in \Bbb{R}. $$ �� $w$ — �� , $x$ — �� , $b$ — �� ; �� .

�� $p\in \Bbb{R}^n$ �� $$ \langle w, p\rangle - b \ge 0, $$ �� , �� $p$ �� ; �� , �� . �� , �� — �� , �� $w\in \Bbb{R}^n$ � �� $b\in \Bbb{R}$.

��

�� , �� . �� , �� : �� , �� , �� — � �� . �� , �� , �.�. �� $x_i$ ��. �� , �� . ��, �� :

�� $h$. ��, �� $h$ �� , �� �� (support), �� (support vector machine).

�� $p$ �� , �� $\langle w, x\rangle - b = 0$: $$ h = (\langle w, p\rangle - b)/|w|, $$ �� $|w|$ �� $w$. �� $$ y_i(\langle w, x_i\rangle - b)/|w| = h, $$ (�� $y_i = \pm 1$). �� : $$ y_i(\langle w, x_i\rangle - b)/|w| \ge h. $$ ��, �� (�� , �� , �� ).

�� $1/h$, ��: $$ y_i(\langle w, x_i\rangle - b)/(|w|\cdot h) \ge 1. $$ �� $w' = w\cdot(1/(|w|\cdot h))$, $b' = b/(|w|\cdot h)$. �� , � �� $x_i$ �� : $$ y_i(\langle w', x_i\rangle - b') \ge 1. $$ �� , �� $w' = w\cdot(1/(|w|\cdot h))$, �� $$ \begin{array}{l} |w'| = |w|/(|w|\cdot h)\quad =\gt \\ h = 1/|w'|. \end{array} $$ �� , �� , �� , �� $2h = 2/|w'|$. �� , �� $w$, $b$ (�� ). ��, �� , �� , �� , �� , �� — � ��. �� $|w|$, ��, �� $|w|$, ��, �� , �� $|w|^2$. �� : $$ \begin{array}{l} y_i(\langle w, x_i\rangle - b) \ge 1, \quad i=1,2,\dots,m \\ |w|^2 \to \min. \end{array} $$

�� , �� -�� .�. �� . ��, �� , �� . �� , �� , �� .

��

� �� $$ y_i(\langle w, x_i\rangle - b) \ge 1, \quad i=1,2,\dots,m $$ ��, �� . �� : �� $\xi_i$ � �� $\xi_i \ge 0$ � �� , �� 1, �� $\xi_i$: $$ y_i(\langle w, x_i\rangle - b) \ge 1 - \xi_i, \quad i=1,2,\dots,m $$ �� $\xi_i$ �� , �� . �� , �� $|w|^2$, �� (� �� ): $$ |w|^2 + �\cdot 1/m\sum_{i=1}^m \xi_i \to \min. $$ �� $C$ — ��-�� . �� $C$, �� . �� $C$ �� , �� . ��, �� $|w|^2$ �� (�� , �� $C$).

��, �� : $$ \begin{array}{l} |w|^2 + C\cdot 1/m\sum_{i=1}^m \xi_i \to \min \\ y_i(\langle w, x_i\rangle - b) \ge 1 - \xi_i, \quad i=1,2,\dots,m \\ \xi_i \ge 0 \end{array} $$

�� . �� $\xi_i$ �� . �� $$ \begin{array}{l} \xi_i \ge 1 - y_i(\langle w, x_i\rangle - b) \\ \xi_i \ge 0 \end{array} $$ �� $\xi_i$ �� , �� , �� $$ \xi_i = \max(1 - y_i(\langle w, x_i\rangle - b), 0). $$ ��, �� $\xi_i$ � �� , ��: $$ |w|^2 + C\cdot 1/m \sum_{i=1}^m \max(1 - y_i(\langle w, x_i\rangle - b), 0) \to \min_{w, b} $$ � �� , �� (�� , �� .�.).

�� $$ H(x) = \max(1 - x, 0), \quad x\in \Bbb{R} $$ �� Hinge Loss. �� :

�� $$ |w|^2 + C\cdot 1/m \sum_{i=1}^m H(y_i(\langle w, x_i\rangle - b)) \to \min_{w, b} $$

�� , �� . �� , �� (Logistic Loss): $$ \begin{array}{l} H2(x) = (\max(1 - x, 0))^2 \\ L(x) = \ln(1 + e^{-x}). \end{array} $$ �� :

�� , �� , �� $m$. �� (�� Python'�: "svm.zip").

��

�� , �� 2 ��. �� , ��, �� , �� . �� . �� .

�� "�� " (one-vs.-rest)

�� $K$. �� , �.�. �� $y_i$, $i=1,\dots,m$, �� $\Bbb{Y}=\{1, 2, \dots, K\}.$ �� $k$, �� $k = 1, 2, \dots, K$, �� $f_k$, �� : $$ \tilde{y}_i = 2(y_i == k) - 1, \quad i = 1,\dots, m. $$ �� $\tilde{y}_i = 1$, �� $y_i = k$, � $\tilde{y}_i = -1$ � �� . �� $k$-� �� $(x_i, \tilde{y}_i)$, $i=1,\dots, m$.

�� $f_k$, $k=1,\dots,K$ �� $(w_k, b_k)$: $$ f_k(x) = \langle w_k, x \rangle - b_k, \quad w_k\in \Bbb{R}^n,\ b_k \in \Bbb{R}. $$ �� $\langle w_k, x \rangle - b_k = 0$ �� $k$-�� , � �� $k$-�� , � �� — �� . ��, �� $f_k(x)$ �� $x$ �� .

� �� $f_k(x)$ (�� ). �� "�� " �� $f_k(x)$ — �� , �� , �� $x$ �� $k$-�� . �� $a(x)$ �� $x$ �� $k$, �� $f_k(x)$ ��: $$ a(x) = \text{argmax}_{k\in\{1,2,\dots,K\}} f_k(x). $$ �� , �� "�� " �� $K$ �� $f_1(x), f_2(x),\dots, f_K(x)$.

�� "�� " �� , �� $f_k(x)$ �� , �� , �.�. � �� . �� , �� "�� ".

�� "�� " (one-vs.-one)

� �� $(k, l)$ �� $a_{k,l}(x)$, �� $\pm 1$: ��, �� , �� $x$ �� $k$, � �� , �� $l$. �� $(x_i, y_i)$, �� $y_i\in\{k, l\}$.

�� $K(K-1)/2$ �� $a_{k,l}(x)$ �� $(k, l)$, �� $1 \le k \lt l\le K$. �� $K$ �� (�� , �� ). �� $a(x)$ �� $k$, �� (�.�. �� ): $$ a(x) = \text{argmax}_{k\in\{1,2,\dots,K\}}( \sum_{1\le l\lt k\le K}(a_{l,k}(x) == -1) + \sum_{1\le k\lt l\le K}(a_{k,l}(x) == 1)) $$ (�� $a_{l,k} == -1$ �� $k$ �� $l$ �� , �� $a_{k,l} == 1$ — �� $k$ �� $l$ �� ; �� , �� 1, �� 0).

����� ������� ��������

���������� ������

���������� ������

������������ ������

�������������� �������������

����� "���� ������ ���������" (one-vs.-rest)

����� "������ ������ �������" (one-vs.-one)

��

��

��

��

��

�� "�� " (one-vs.-rest)

�� "�� " (one-vs.-one)