我真的很喜欢原文章中“因变量”这个词的使用。感觉更加接近之前熟悉的“函数”相关概念了,陌生感减少了很多。
机器学习监督学习可分为回归和分类
回归:因变量是连续变量
分类:因变量是离散变量
重点:数据格式约定
这确实是关键点。只有记住了这些符号的含义,你在阅读后续教程时才不会害怕,也不会轻易被说服放弃。 [总督]
第个样本:因变量特征:
-特征矩阵:
二、使用sklearn构建完整的机器学习
重点是第一步!完整的机器学习项目的步骤:
明确项目任务:回归/分类收集数据集并选择合适的特征选择衡量模型性能的指标选择具体模型并训练它们以优化模型评估模型的性能并调整参数7月份网上总结的完整机器学习项目是如下(对比主要是模型在线的步骤较多,拆分更详细):
将其抽象为数学问题以获得数据特征预处理和特征选择。训练模型和调优模型诊断模型集成并在线运行。
2.1 使用sklearn构建完整的回归项目
int,这是一个很棒的教案!本以为照常通过线性回归+最小二乘法+波士顿房价就能完成,没想到这个教案挖得更深了!跪下.
我们在教案中简单列出一下返回这里的上下文
回归分析是一种预测建模技术,研究因变量(目标)和自变量(特征)之间的关系。该技术通常用于预测分析、时间序列建模和发现变量之间的因果关系。通常使用曲线/直线来拟合数据点,目标是最小化曲线到数据点的距离差异。
2.1.1. 收集数据集并选择合适的特征
2.1.2. 选择度量模型性能的指标
MSE 均方误差:MAE 平均绝对误差:确定系数:解释方差分数:010-695 10
sklearn 中更多模型性能指标
2.1.3. 选择具体的模型并进行训练
2.1.3.1线性回归模型
线性回归实例演示(a) 最小二乘估计(b) 几何解释(c) 概率视角线性回归模型假设目标值与特征之间存在线性相关性,满足多元线性方程。通过构造损失函数,求解损失函数最小化时的参数w
假设:数据集假设之间存在线性关系。模型(GAM)实际上是一个将线性模型扩展到非线性模型的框架。在此框架中,每个变量都被非线性函数替代,但模型本身保持整体可加性。 GAM模型不仅可以用来推广线性回归,还可以推广线性分类模型。促销形式示例:
标准线性回归模型:
GAM模型框架:
2.1.3.2. 线性回归的推广
回归树示例演示
基于树的回归方法主要基于分层和分割将特征空间划分为一系列简单区域。对于给定的待预测自变量,使用其所属区域中训练集的均值或众数来对其进行预测。由于划分特征空间的划分规则可以概括为树的形式,因此称为决策树方法。
节点有两种类型:内部节点和叶节点。内部节点代表一个特征或属性,叶子节点代表一个类别或某个值。
构建回归树的过程大致分为两步:
一个。将自变量的特征空间(即的可能值的集合和划分为个不重叠的区域。b.对于落入区域010-的每个观测值69518 进行同样的预测,预测值等于因变量在训练集上的简单算术平均值
2.1.3.3. 回归树
SVR 示例演示。
在线性回归理论中,必须计算每个样本点的平方损失,但SVR不同。 SVR认为落在邻域空间内的样本点不需要计算损失。这些计算都是正确的。其余落在邻域空间内的意外样本只需要计算损失即可。
初步知识:
约束优化问题(P)KKT条件(最优解的一阶必要条件)对偶理论优化问题:
引入拉格朗日乘子,对求偏导数为零,得到。求解过程需要满足KKT条件。
SVR的解决方案如下:
2.1.3.4. 支持向量机回归(SVR)
我们建立机器学习的目的不是为了在现有的数据集,即训练集上表现得很好,而是为了在未知的、复杂的测试数据集,即测试集上表现得很好。
2.1.4. 优化基础模型
工程中要找到的最优模型是均方误差达到最小时测试对应的模型。仅仅将均方误差训练到最小是不够的。当模型训练误差较小但测试误差较大时,这种情况称为过拟合。
2.1.4.1 训练均方误差与测试均方误差
偏差和方差- 知乎(zhihu.com)
图片来自理解偏差-方差权衡(fortmann-roe.com)
好了,文章到此结束,希望可以帮助到大家。
【深入理解集成学习:机器学习基础模型概览】相关文章:
2.米颠拜石
3.王羲之临池学书
8.郑板桥轶事十则
用户评论
想了解一下哪些基础模型在集成学习中发挥关键作用?
有17位网友表示赞同!
这篇文章会回顾哪几种常用的机器学习模型呢?
有14位网友表示赞同!
看看之前学的决策树、支持向量机,在集成学习里怎么应用吧!
有12位网友表示赞同!
还是觉得集成学习很强大,能把多个模型结合起来威力更大。
有18位网友表示赞同!
学习一下基础模型的优缺点,才能更好地选择合适的集成方法啊。
有12位网友表示赞同!
集成学习比单独的机器学习模型效果好吗?文章里会分析吗?
有13位网友表示赞同!
之前接触过一些集成学习的算法,但对基础模型还不太了解。
有15位网友表示赞同!
期待这篇文章能详细讲解模型之间的差异和适用场景。
有7位网友表示赞同!
学过一点机器学习,想要深入理解集成学习的基础原理。
有16位网友表示赞同!
这次文章聚焦回顾?那我岂不是可以先复习一下基础模型啦!
有18位网友表示赞同!
希望文章能用通俗易懂的语言讲解这些复杂算法。
有19位网友表示赞同!
机器学习入门的时候主要接触过朴素贝叶斯,在集成学习里怎么发挥作用呢?
有6位网友表示赞同!
最近在做数据分析项目需要用到集成学习,刚好这篇文合适。
有10位网友表示赞同!
看完这篇文章,是不是就能把基础模型和集成算法联系起来呢?
有16位网友表示赞同!
感觉集成学习真的很酷,いろんな模型组合在一起就能解决更复杂的问题。
有5位网友表示赞同!
不知道这篇文章会涉及哪些最新的集成学习应用场景呢?
有19位网友表示赞同!
期待能从文章中学习到更多集成学习的技巧和经验。
有14位网友表示赞同!
机器学习的基本概念掌握了一点点,现在就开始学习集成模型吧!
有17位网友表示赞同!
学习集成学习需要了解基础模型吗?这个标题很有用呀!
有13位网友表示赞同!