AI12 过拟合与欠拟合

在模型评估与调整的过程中,往往会遇到“过拟合”或“欠拟合”的情况。如何有效地识别“过拟合”和“欠拟合”现象,并有针对性地进行模型调整,是不断改进机器学习模型的关键。特别是在实际项目中,采用多种方法、从多个角度降低“过拟合”和“欠拟合”的风险是算法工程师应当具备的领域知识。

阅读全文

AI11 超参数调优

对很多算法工程师来说,超参数调优是件非常头疼的事。除了根据经验设定所谓的“含理值”之外,一般很难找到合理的方法去寻找超参数的最优取值。与此同时,超参数对于模型效果的影响又至关重要。

阅读全文

AI11 模型评估的方法

在机器学习种,我们通常把样本分为训练集和测试集,训练集用于训练模型,测试集用于评估模型。在样本划分和模型验证的过程中,存在着不同的抽样方法和验证方法。

阅读全文

AI10 A/B测试的陷阱

在互联网公司中,A/B测试是验证新模块、新功能、新产品是否有效,新算法、新模型的效果是否有提升,新设计是否受到用户欢迎,新更改是否影响用户体验的主要测试方法。在机器学习领域中,A/B测试是验证模型最终效果的主要手段。

阅读全文

AI08 ROC曲线

二值分类器(Binary Classifier)是机器学习领域中最常见也是应用最广泛的分类器。评价二值分类器的指标很多,比如precision、recall、F1 score、P-R曲线等。但这些指标或多或少只能反映模型在某一方面的性能。相比而言,ROC曲线则有很多优点,经常作为评估二值分类器最重要的指标之一。

阅读全文

在机器学习中,绝大部分模型都需要大量的数据进行训练和学习(包括有监督学习和无监督学习),然而在实际应用中经常会遇到训练数据不足的问题。不如图像分类,作为计算机视觉最基本的任务之一,其目标是将每副图像划分到指定类别集合中的一个或多个类别中。当训练一个图像分类模型时,如果训练样本比较少,该如何处理?

阅读全文

在模型评估过程中,分类问题、排序问题、回归问题等往往需要使用不同的指标进行评估,在诸多的评估指标中,大部分指标只能片面地反映模型的一部分性能。如果不能合理地运用评估指标,不仅不能发现模型本身的问题,而且会得出错误的结论。

阅读全文

作者的图片

努力学习AI的Qi

一个铁憨憨的个人博客站w(゜Д゜)w

AI炼金术师,科学史爱好者

湖南,长沙