感知机:
假设输入空间是$\chi\subseteq R^n$,输出空间是$\gamma =\left( +1,-1\right)$。输入$\chi\in X$表示实例的特征向量,对应于输入空间的点;输出$y\in \gamma$表示实例的类别。由输入空间到输出空间的如下函数:
称为感知机。其中,w和b为感知机模型的参数,sign是符号函数,即:
感知机学习策略
假设训练数据集是线性可分的,感知机学习的目标就是求得一个能够将训练集正实例点和负实例点完成正确分开的分离超平面。为了找出这样的超平面,即确定感知机模型参数w,b,需定义损失函数并将损失函数极小化。
损失函数使用误分类点到超平面S的总距离,因此输入空间$R^n$中任何一点$x_0$到超平面S的距离为:
在这里,$\left|| w\right||$是w的$L_2$范数。
对于误分类的数据$\left(x_i,y_i\right)$来说,