博文

深度学习（三）

已有 1075 次阅读 2023-2-28 19:46 |个人分类:学习笔记|系统分类:科研笔记

一、验证集、测试集、训练集

验证集和测试数据集不同在于，验证集在训练过程中使用，测试数据集在建模之后使用，在竞赛中一般验证集是线下验证集，因为线上提交次数有限，为了更好的检验模型效果，验证集被用来进行线下模型的评估。

二、监督学习、半监督学习、无监督学习

监督学习是学习给定标签的数据集，监督学习又有不同分类，如果预测结果是离散类型，则是分类，如果恰好预测结果只有两种类别，就是二分类，多种类别为多分类

如果预测结果是概率这类连续型数字，则是回归问题

无监督学习是学习没有标签的数据集，使用聚类来把样本聚集到几个簇

半监督学习的数据集比较特殊是部分有标签部分无标签的数据集，由于有标签的数据成本高，数量少，而无标签的数据多，我们希望通过未标记的数据去增强标记数据的训练效果，这就需要半监督学习

三、模型评估指标

对于二分类问题，可将样例根据其真实类别与学习器预测类别的组合划分为真正例（True Positive，TP）、假正例（False Positive, FP）、真反例（True Negative, TN）、假反例（False Negative, FN）四种情形。令TP、FP、TN、FN分别表示其对应的样例数，则显然有TP+FP+TN+FN=样例总数。分类结果的“混淆矩阵”（Confusion Matrix）如下

为了评估一个模型的好坏，针对不同的场景通常我们需要不同的评价指标。

（1）Fl-score

（2）AUG

ROC曲线的纵轴是“真正例率”（True Positive Rate，简称TPR），横轴是"假正例率”（False Positive Rate.简称FPR），描绘出ROC曲线图，计算出 ROC曲线下的面积，便得到了AUC值。

（3）RMSE & MSE

RMSE（Root Mean Squard Error）均方根误差，MSE（Mean Squared Error）均方误差，这两个评价指标都是针对于回归模型的

转载本文请联系原作者获取授权，同时请注明本文来自黄兰淇科学网博客。
链接地址：https://wap.sciencenet.cn/blog-3549363-1378360.html

上一篇：深度学习（二）
下一篇：日常感悟（二）

收藏 IP: 124.127.4.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

黄兰淇

扫一扫，分享此博文

huanglanqi711的个人博客分享 http://blog.sciencenet.cn/u/huanglanqi711

博文

深度学习（三）

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

黄兰淇

全部作者的其他最新博文

全部精选博文导读

huanglanqi711的个人博客分享 http://blog.sciencenet.cn/u/huanglanqi711

博文

深度学习（三）

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

黄兰淇

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)