模型的性能度量

模型的性能度量

性能度量:评价模型泛化能力的标准。

均方误差

回归模型的性能度量通常选用均方误差(Mean Squared Error)。

分类算法的性能度量

  • 错误率:分类错误的样本占总样本的比例。
  • 精度:分类正确的样本占总样本的比例。
  • 查准率:预测结果为正的样本中实际值也为正的比例。(例如:一个50个的样本,10个是标记为正确的,模型找到19个是正确的,这19个中包含9个是标记为正确的,此时查准率为9/19)
  • 查全率:实际值为正的样本中被预测为正的样本比例(例如:一个50个的样本,10个是标记为正确的,模型找到19个是正确的,这19个中包含9个是标记为正确的,此时查准率为9/10)
  • P-R曲线:查准率-查全率曲线.
  • 混淆矩阵:将预测分类结果和实际分类结果做成矩阵的形式显示。
  • $F_\beta$-score:$\beta$值的不同体现了对查全率和查准率的不同倾向,其公式为
  • 受试者特征曲线(ROC)和曲线下面积(AUC):TPR-FPR曲线(真正例率-假正例率曲线)
    正确肯定(True Positive,TP):预测为真,实际为真
    正确否定(True Negative,TN):预测为假,实际为假
    错误肯定(False Positive,FP):预测为真,实际为假
    错误否定(False Negative,FN):预测为假,实际为真
  • 代价曲线:不同类型的预测错误对结果影响不同而增加代价(cost),绘制$P(+)cost-{cost}_{norm}$曲线

聚类算法的性能量度

  • 外部指标(External Index):将聚类结果同某个参考模型进行比较
    1. Jaccrd系数(Jaccrd Coefficient,JC):
    2. FM指数(Fowlkes and Mallows Index,FMI):
    3. Rand指数(Rand Index,RI):
  • 内部指标(Internal Index):不使用参考模型直接考察聚类结果
    1. DB指数(Davise-Bouldin Index,DBI):
    2. Dunn指数(Dunn Index,DI):

参考资料和相关网址

[吴恩达机器学习笔记]11机器学习系统设计3-4/查全率/查准率/F1分数:https://www.cnblogs.com/cloud-ken/p/9588318.html


 上一篇
Latex常用数学符号 Latex常用数学符号
Latex常用数学符号数学模式重音符号 符号 表示方式 符号 表示方式 符号 表示方式 $\hat{a}$ \hat{a} $\check{a}$ \check{a} $\tilde{a}$ \tilde{a} $\gra
2019-07-18
下一篇 
模型评估与选择 模型评估与选择
模型评估与选择模型选择误差误差误差(Error):是模型的预测输出值与其真实值之间的差异。 训练训练(Training):通过已知的样本数据进行学习,从而得到模型的过程。 训练误差训练误差(Training Error):模型作用于训练集时
2019-07-15
  目录