测量预测过程中的预测错误的标准差

公式

\[RMSE(X,h)=\sqrt{\frac{1}{m}\sum_{i=1}^{m}(h(x^{(i)}) - y^{(i)})^2}\]

  • m 是你在测量 RMSE 时,所使用的数据集中实例的数量
  • \(x^{(i)}\) 是数据集中第 \(i\) 个实例的所有特征值的向量(标签特征除外),\(y{(i)}\) 是标签(也就是我们期待该实例的输出值)
  • X 是数据集中所有实例所有特征值的矩阵(标记特征除外)。每个实例一行,也就是说第 \(i\) 行等于 \(x^{(i)}\) 的转置矩阵1,记作 \((x^{(i)})^T\)
  • h 是系统的预测函数,也称为一个假设。当给定系统一个实例的特征向量 \(x^{(i)}\) ,他会输出一个预测值 \(\hat{y}=h(x^{(i)})\)
  • RMSE(X,h) 是使用假设 h 在示例上测量的成本函数。

  1. 转置运算符会将列向量转换成行向量。 ↩︎