多特征线性回归

有多个特征的线性回归就是我们常说的多变量线性回归。我们先申明一些数学标记的含义：

$x_j^{(i)}$ 代表第i个样本中第j个特征
$x^{(i)}$ 代表第i个样本的所有特征
$m$ 代表训练样本个数
$n$ 代表特征个数

模型的多变量形式如下：

h θ (x) = θ 0 + θ 1 x 1 + θ 2 x 2 + \dots + θ n x n

$h_\theta(x) = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \cdots+ \theta_n x_n$
为了便于理解，我们可以抽象一种情形，

θ0 $\theta_0$ 代表房屋的基本价格，

θ1 $\theta_1$ 代表每平米的价格，

θ2 $\theta_2$ 代表每层的价格，

x1 $x_1$ 代表房屋面积，

x2 $x_2$ 代表房屋层数。

通过矩阵乘法，多项式可以写成矩阵的形式：

h θ (x) = [θ 0 θ 1 θ 2 \dots θ n] ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ x 0 x 1 x 2 \dots x n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ = θ T x

$h_\theta(x) = \begin{bmatrix} \theta_0 & \theta_1 & \theta_2 & \cdots & \theta_n \end{bmatrix} \begin{bmatrix} x_0 \\ x_1 \\ x_2 \\ \cdots \\ x_n \end{bmatrix} = \theta^Tx$

则成本函数（代价函数）可以写作：

J (θ 0, θ 1, \dots, θ n) = 1 2 m \sum i = 1 m (h θ (x (i)) - y (i)) 2

$J(\theta_0, \theta_1, \cdots, \theta_n) = \frac{1}{2m} \sum_{i=1}^m (h_\theta(x^{(i)}) - y^{(i)})^2$

对单个 $\theta_j$ 进行梯度下降有：

θ j θ j : = θ j - α \partial \partial θ j J (θ) : = θ j - α 1 m \sum i = 1 m (h θ (x (i)) - y (i)) x (i) j

$\begin{align} \theta_j & := \theta_j - \alpha \frac{\partial}{\partial \theta_j} J(\theta) \\\theta_j & := \theta_j - \alpha \frac{1}{m} \sum_{i=1}^m (h_\theta(x^{(i)}) - y^{(i)})x_j^{(i)}\end{align}$

实用技巧——特征缩放(feature scaling)
动机：保证特征在相似的范围内
特征范围差异大会极大减缓收敛速度，梯度下降的迭代过程中会出现震荡现象。
例如：
$x_1$ 表示房屋面积(0-2000)平方米
$x_2$ 表示卧室数量(1-5)

x 1 x 2 = s i z e ( f e e t 2 ) 2000 = n u m b e r o f b e d r o o m 5

$\begin{align} x_1 & = \frac{size(feet^2)}{2000} \\ x_2 & = \frac{number\ of\ bedroom}{5} \end{align}$

如果我们想把特征范围控制在[-1, 1]之间，可以进行以下变化：

x i : = x i - μ i s i

$x_i := \frac{x_i - \mu_i}{s_i}$
其中

μi $\mu_i$ 是特征i的均值，

si $s_i$ 是特征的范围值(max - min)。

学习率选择
如果学习率太小，梯度下降会收敛的很慢；
如果学习率太大，每次迭代 $J(\theta)$ 反而会增大，导致无法收敛。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 162202241@qq.com 举报，一经查实，本站将立刻删除。

1313e

多特征线性回归

取消回复欢迎您发表评论:

默认分类  间隔的直观理解

python python3脚本获取本机公网ip

默认分类  最优间隔分类器（一）

默认分类  07 ，日志入库项目：

默认分类  ConcurrentHashMap结构及原理

1313e

多特征线性回归

取消回复欢迎您发表评论:

默认分类 间隔的直观理解

python python3脚本获取本机公网ip

默认分类 最优间隔分类器（一）

默认分类 07 ，日志入库项目 ：

默认分类 ConcurrentHashMap结构及原理

默认分类间隔的直观理解

默认分类最优间隔分类器（一）

默认分类 07 ，日志入库项目：