自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (6)
  • 收藏
  • 关注

原创 朴素和半朴素贝叶斯

引入贝叶斯决策论是概率框架下实施决策的基本方法,它基于概率和误判误差的最小化来进行判别,是一种分类问题的解法。原理首先,将数据及其属性记为x,对于多分类任务,其可能的取值有N种,设为{c1,c2,c3.....cNc1,c2,c3.....cNc_1,c_2,c_3.....c_N},统称为c。数据x的正确分类记为cxcxc_x。于是将算法的正确率记为:​ ...

2018-07-22 21:27:01 1266 1

原创 模型的选择、评估和优化-下

模型评估上文叙述了当机器学习模型已经训练完成之后,我们该如何评估模型的好坏。但是一般而言,机器学习模型的训练时间较长,在训练过程中,我们怎么样判断模型训练的状态和优劣呢?之前说过,训练过程中的最容易出现的问题就是过拟合和欠拟合,下面介绍判断拟合状态的方法。之前介绍过方差、偏差的概念以及他们的意义,在训练过程中,我们会得到训练集和测试集的总误差,通过这两个参数,我们可以判断出算法的拟...

2018-07-21 15:23:03 1096

原创 模型的选择、评估和优化-上

引入对于一个机器学习工程而言,我们可以选择的模型众多,就之前的章节,我们已经可以选择:线性回归logistics判别决策树神经网络对于一个模型而言,我们也有很多模型参数需要人工选择,本章将对模型的评估选择和优化进行详细介绍。概念介绍过拟合和欠拟合在机器学习中,我们期望通过训练集来得到在新样本上表现的很好的学习器,找出潜在样本的普遍规律,在训练过程中,可能会...

2018-07-21 15:20:45 8978

原创 神经网络初探

神经网络初探在本文中,我将初步介绍神经网络有关的概念和推导,本文是后续深度学习的入门,仅对神经网络做初步理解,后续文章中会继续进行学习。定义什么是神经网络呢?这里引用Kohonen的定义: 神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。可以看出神经网络的几个重要特点:简单的基本单元、互连、模拟生物...

2018-07-19 17:42:28 380

原创 决策树详解

定义决策树是一种常见的机器学习算法,它的思想十分朴素,类似于我们平时利用选择做决策的过程。 例如有人给我们介绍新的对象的时候,我们就要一个个特点去判断,于是这种判断的过程就可以画成一棵树,例如根据特点依次判断: 如上,决策的形式以树的形式进行示意和编码,就形成了决策树。结构显然,决策树在逻辑上以树的形式存在,包含根节点、内部结点和叶节点。 - 根节点:包含数据集中...

2018-07-18 20:42:46 77315 6

原创 logistics判别与线性模型中的问题

之前说过,机器学习的两大任务是回归和分类,上章的线性回归模型适合进行回归分析,例如预测房价,但是当输出的结果为离散值时,线性回归模型就不适用了。我们的任务是:将回归分析中的实数值转化为离散值或者对于离散值的概率logistic判别转换函数例如我们进行癌症判定,回归模型可以输出癌症几率a,并且 a∈(0,1)a∈(0,1)a\in (0,1),而我们的任务是将几率转化为0、1两个...

2018-07-17 10:24:31 1394

原创 线性回归和梯度下降

在上一章我们说到,机器学习中主要的两个任务就是回归和分类。如果读者有高中数学基础,我们很容易回忆到我们高中学习过的一种回归方法——线性回归。我们将这种方法泛化,就可以得到机器学习中的一种常见模型——线性模型,线性模型是监督学习的一种。 我们已经说过,我们要从数据集中训练出模型,每个数据可以视为(属性,标签)二元组。其中属性可以为属性向量。 假设给定具有n个属性的属性向量的数据 x⃗ ...

2018-07-17 10:20:07 9201 1

原创 机器学习的概念、历史和未来

相关概念提起机器学习,我们不得不给机器学习下一个准确的定义。在直观的层面,如果说计算机科学是研究关于算法的科学,那么机器学习就是研究关于“学习算法”的科学,或者说,不同于一般的显式编程,机器学习就是研究如何使得计算机在无法被显式编程的情况下进行学习的领域,需要注意的是,显式与否都是对于人类而言的——人类能否明确的搞清楚每个决策步骤,对于计算机而言,构成不同算法的代码与指令没有任何区别。 更加...

2018-07-17 10:17:00 6597

原创 机器学习系列文章序言

专栏介绍机器学习专栏是我在2018年暑假开始全面入门机器学习的心得和总结,在这个为期接近三个月的暑假中,我会学习传统机器学习,深度学习,以及强化学习三类主要的机器学习方法。 在本栏目中,我不会照葫芦画瓢的搬抄其他地方的资料,所有的文章均为原创,均为我的心得体会和总结。所以存在一定程度的简洁和省略。 本专栏的目的是和想入门机器学习的朋友们一起交流,共同成长,也是对自己学习的一种监督和升华...

2018-07-17 10:11:47 331

原创 最佳乘法问题

题目描述 给一个长度为 n的数字串,只包含数字0-9,现在让你在这个串中间插入 k 个乘号, 将数字串分为k+1 个部分,使得这k+1个数字的乘积最大。 输入 字符串 k 输出 乘法结果 示例 312 1 62 解题思路 p【m】【n】表示前m个字符中插入n个乘号的最大值,p【m+1】【n】=max{p【i】【n】+nu

2017-05-18 11:32:51 340

原创 硬币问题(刘汝佳266,)

题目描述: 硬币找零问题描述:现存在一堆面值为 V1、V2、V3 … 个单位的硬币 问最多和最少需要多少个硬币才能找出总值为T个单位的零钱? 输入: 第一行为n,T,表示硬币个数,需要凑的面额,第二行有n个数,表示硬币的面额 输出: 一行,分别为最大最小的数目,用空格分开 示例: 输入 5 63 1、2、5、21、

2017-05-18 10:20:41 690

原创 嵌套矩形(刘汝佳262,NYOJ16)

描述 有n个矩形,每个矩形可以用a,b来描述,表示长和宽。矩形X(a,b)可以嵌套在矩形Y(c,d)中当且仅当a小于c,b小于d或者b小于c,a小于d(相当于旋转X90度)。例如(1,5)可以嵌套在(6,2)内,但不能嵌套在(3,4)中。你的任务是选出尽可能多的矩形排 成一行,使得除最后一个外,每一个矩形都可以嵌套在下一个矩形内。输入 第一行是一个正正数N(0小于N小于10),

2017-05-17 23:16:54 601

csapp arch lab 满分原创(北大&cmu;) 全集ABC 仅供参考,请勿抄袭

csapp arch lab 满分原创(北大&cmu;) 全集ABC 仅供参考,请勿抄袭

2017-12-27

csapp proxy lab 满分原创(北大&cmu;) 仅供参考,请勿抄袭

可以拿到满分的网络代理,采用读者优先的方式避免竞争,避免了pipe broken造成的服务器中断。

2017-12-27

csapp malloc lab 原创(北大&cmu;) 仅供参考,请勿抄袭

采用seg-list结构,易于理解,适合和我一样的弱渣使用,好好调参,可以得到93分,我觉得可以接受

2017-12-27

csapp shell lab 满分原创(北大&cmu;) 仅供参考,请勿抄袭

csapp shell lab 满分原创(北大&cmu;) 仅供参考,请勿抄袭

2017-12-27

csapp cache lab 满分原创(北大&cmu;) 仅供参考,请勿抄袭

csapp cache lab 满分原创(北大&cmu;) 仅供参考,请勿抄袭

2017-12-27

csapp data lab 满分原创(北大&cmu;) 仅供参考,请勿抄袭

csapp data lab 2016年版本 满分原创(北大&cmu;) 仅供参考,请勿抄袭

2017-12-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除