- 博客(5)
- 收藏
- 关注
原创 机器学习笔记(三)过拟合、欠拟合与正则化
一、过拟合与欠拟合1.定义过拟合与欠拟合都是机器学习建模过程中可能遇到的问题。欠拟合指模型在训练过程中对训练集拟合效果差,一般是由于模型的复杂度过低;过拟合指模型在训练过程中对训练集拟合效果好,但在测试过程中对测试集拟合效果差,即模型的泛化能力差,一般是由于建立的模型过于复杂。2.出现原因出现欠拟合情况的原因一般是模型还未完成学习,在后续的学习过程中一般能够得到改善。出现过拟合情况的原因一般为:1.训练集数据类型单一或数据量过小2.训练数据当中噪声干扰过大3.模型过于复杂(包含了过多特征)
2022-04-13 14:56:06 925
原创 机器学习笔记 (二)Logistic回归
一、Logit函数和Sigmoid函数二、模型形式hθ(x)=11+e−θTxh_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}hθ(x)=1+e−θTx1其中θ=(θ0,θ1,θ2,...,θn)T\theta=(\theta_0,\theta_1,\theta_2,...,\theta_n)^Tθ=(θ0,θ1,θ2,...,θn)T,x=(1,x(1),x(2),...,x(n))Tx=(1,x^{(1)},x^{(2)},...,x^{(n)})^Tx=(
2022-04-11 16:08:51 1394
原创 机器学习笔记 (一) 线性回归
前言lz最近开始学习机器学习算法,为了防止现在学到的知识在未来一段时间慢慢遗忘,在学习途中作此纪录,方便未来回顾。本文记录的算法是线性回归算法。一、名词解读1.线性什么是线性?顾名思义,线性的意思就是数学模型的几何表现是一条直线,这是基于模型中因变量(机器学习中称为特征或属性)是一元的情况。当模型中因变量为二元(特征向量是二维)时,其在几何上的表现则是一个平面,而当模型中因变量为多元(特征向量是多维)时,其在几何上的表现是一个超平面。2.回归在有监督算法中,当因变量y是连续性变量时,需要使用回
2022-04-10 17:07:09 986
原创 SQL窗口函数
SQL窗口函数一、窗口函数应用场景:分组处理数据二、窗口函数基本语法<窗口函数> over (partition by <用于分组的字段名> order by <用于排序的字段名>)上面代码含义为:首先将数据表根据<用于分组的字段名>分段,并且根据<用于排序的字段名>排序,而后对经过这两步处理的数据表执行<窗口函数>注:partition by与group by的区别:group by改变了表的行数,经过分组后每
2021-03-16 16:13:54 105
原创 SQL数据表的建立与修改
SQL数据表的建立与修改前言一、SQL数据表的建立1.普通建表语句2.建表时检查是否有重复表:3. 建表时从已有表格中引入数据:二、插入数据1.插入单条记录:2.插入多条记录:3.向某几个字段插入单条记录:4.插入记录时避免重复:总结前言第一次写CSDN博客,权作为数据分析学习路上的记录提示:以下是本篇文章正文内容,下面案例可供参考一、SQL数据表的建立1.普通建表语句CREATE TABLE <表名>(<字段名> <字段格式> <是否为空(一般.
2020-12-18 16:26:23 169
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人