自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 资源 (1)
  • 收藏
  • 关注

原创 PCA

PCA简介

2018-02-08 10:57:13 286

原创 LDA

LDA简介

2018-02-07 15:54:01 455

原创 集成学习

集成学习1.Bagging1.1 随机森林RF1.2 随机森林优缺点1.3 Bagging与RF区别2.Boosting2.1 Boosting和Bagging区别2.2 AdaBoost2.3 提升树Boosting Tree2.4 梯度提升决策树Gradient Boosting Decision Tree2.4 GBDT

2018-02-07 15:42:27 598 2

原创 机器学习概论

机器学习概论

2018-02-07 14:58:16 213

原创 偏差-方差权衡

偏差-方差权衡偏差表示了学习算法的期望预测输出与真实输出的偏离程度,刻画了学习算法本身的拟合能力,反映了模型的准确性;方差表示了同样大小的训练集的变动所导致的学习性能的变化,刻画了数据扰动所造成的影响,反映了模型的稳定性;噪声表示给定学习任务下任何学习算法的期望泛化误差下界,反映了学习任务本身的难度。类似于打靶射击:偏差小方差大表示打的靶都在靶心附近,瞄的准但是

2018-02-07 14:42:50 793

原创 LR与SVM的区别

LR与SVM的区别相同点:1.LR和SVM都是分类算法;2.如果不考虑核函数,LR和SVM都是线性分类算法,即它们的分类决策函数都是线性的;3.LR和SVM都是监督学习算法;4.LR和SVM都是判别模型。不同点:1.从目标函数来看,LR采用的是对数损失函数,SVM采用的是合页损失函数。这两个损失函数的目的都是增加对分类影响较大

2018-02-07 14:39:06 734

原创 学习曲线的解读

学习曲线的解读学习曲线是什么?学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型是否方差偏高或偏差过高,以及增大训练集是否可以减小过拟合。怎么解读?1、当训练集和测试集的误差收敛但却很高时,为高偏差。 左上角的偏差很高,训练集和验证集的准确率都很低,很可能是欠拟合。 我们可以增加模型参数,比如,

2018-02-07 14:37:40 2785

原创 机器学习性能评估指标

机器学习性能评估指标

2018-02-07 14:06:35 173

原创 推荐系统

推荐系统1 什么是推荐系统如果一个用户有明确的需求,比如想买一包花生米,那么他可以去便利店根据分类牌找到自己的喜欢牌子的花生米,或者在淘宝上利用搜索引擎直接寻找。但是,如果用户没有明确的需求时,比如说,你今天很无聊,想下载一部电影看看。但是当你打开某个下载网站时,面对100年来发行的数不胜数的电影,你会手足无措,不知道该看哪一部。此时,你遇到了信息过载的问题,需要一个工具来帮助你做筛选,它

2018-02-07 13:41:38 1757

原创 机器学习常用算法的调用

机器学习常用算法的调用一、线性回归(LinearRegression)线性回归是利用连续性变量来估计实际数值(例如房价,呼叫次数和总销售额等)。我们通过线性回归算法找出自变量和因变量间的最佳线性关系,图形上可以确定一条最佳直线。这条最佳直线就是回归线。这个回归关系可以用Y=aX+b表示。Python代码:from sklearn import linear_modelx_t

2018-02-07 11:59:13 1728

翻译 特征工程

特征工程1 特征工程是什么?2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化与归一化的区别2.2 对定量特征二值化2.3 对定性特征哑编码2.4 缺失值计算2.5 数据变换2.6 回顾3 特征选择3.1 Filter3.1.1 方差选择法3.1.2

2017-12-26 19:16:04 242

原创 740. Delete and Earn

740. Delete and Earn删除和收益题目:给定一个数组,删除一个数,那么这个数组中比它大1和小1的数都会被删除,与此同时你可以得到这个数对应的分值,问最最多可以得到几分。解题思路:1、将所有的数装入相应的桶中value,即相同的数在一个桶中。2、skip_i:如果你保留i桶,那么0-i号桶的最优解;take_

2017-12-23 22:39:43 167

原创 516. Longest Palindromic Subsequence

516. Longest Palindromic Subsequence最长回文子序列题目:给定一个字符串,求其最长回文子序列。注意:子序列和子字符串不同,不需要连续。解题思路:动态规划。定义dp[i][j]代表[i,j]区间内字符串的最长回文子序列。dp[i][i]=1分两种情况:1、s[i]=s[j]时,d

2017-12-21 22:44:07 213

原创 746. Min Cost Climbing Stairs

746. Min Cost Climbing Stairs爬楼梯的最小代价题目:给定一个数组代表楼梯第i层的代价,初始时可以从cost[0]爬起,也可以从cost[1]开始爬起。一旦你支付费用,便可以爬一步或者两步。求爬完楼梯的最小代价。解题思路:动态规划。dp[i]:代表爬到第i层的最小代价。dp[i]=cost[i]+mi

2017-12-21 22:43:07 192

原创 474. Ones and Zeroes

474. Ones and Zeroes1和0题目:给定若干个由0和1组成的字符串数组,现在限定使用m个0和n个1,每个0和1至多使用1次,问最多能组成多少个给定的字符串。解题思路:动态规划。有点类似于0-1背包问题。dp[i][j]表示有i个0和j个1时最多能组成的字符串的个数。dp[i][j]=max(dp[i][

2017-12-21 22:41:36 200

原创 446. Arithmetic Slices II - Subsequence

446. Arithmetic Slices II - SubsequenceArithmetic序列题目:给定一个数组,判断该数组中有多少Arithmetic子序列。Arithmetic子序列定义为:长度大于2的,并且每相邻两个元素之间拥有相同的差值。解题思路:动态规划。定义一个一维数组dp,dp中的元素为哈希表,这个哈希表

2017-12-21 22:40:00 213

原创 494. Target Sum

494. Target Sum目标和题目:给定一个非负的整数数组,a1,a2,a3,...,an,以及一个目标值s。现在你有两个符号“+”和“-”,对于每一个整数分配一个符号,找出有多少种符号分配方式使得整数的和等于目标s。解题思路:深度优先搜索。我们从第一个数字,调用递归函数,在递归函数中,分别对目标值进行加上当前数字调用递归,和减

2017-12-21 19:59:31 132

原创 416. Partition Equal Subset Sum

416. Partition Equal Subset Sum相同子集和分割题目:给定一个非空数组,判断数组是否可以被分成两个子数组,这两个子数组的和相等。解题思路:动态规划。如果我们可以找到两个子数组相等的情况,那么每个子数组的和应该是和的一半target。定义dp[i]表示数字i是否是原数组的任意个子集合的和,那么我们最后返回dp

2017-12-21 19:57:18 236

原创 410. Split Array Largest Sum

410. Split Array Largest Sum分割数组最大和题目:给定一个非负整数的数组和一个整数m,你可以将数组分割为m个非空的子数组,求最小化m个子数组中的最大和。解题思路:动态规划。定义dp[i][j]为:前i个数被分割成j个子数组的最小的最大子数组和。dp[0][0]=0;j的范围应该是[1,nums

2017-12-21 19:56:11 137

原创 403. Frog Jump

403. Frog Jump青蛙过河题目:一只青蛙正在横渡一条河。这条河分为X个单元,每一个单元可能有或者没有一块石头。青蛙只能跳到石头上而不能跳进水中。注意:给定一个升序排列的石头的位置(单元),判断青蛙能否通过登陆最后一块石头成功过河。初始时,青蛙在第一块石头上,并且假设第一次跳跃必须是一个单元。如果青蛙的最后一次跳跃是k个单位,

2017-12-21 19:54:54 220

原创 392. Is Subsequence

392. Is Subsequence是否是子字符串题目:假设两个字符串中都只包含小写字母。t的长度可能很长,s的长度可能很短。子字符串的定义:从字符串中删除若干个字符串后,剩余的字符的相对顺序保持不变得到的新字符串。解题思路:遍历s和t,如果对于s中的一个字符,t的当前字符与其不匹配,则t++; 否则,s++,t++。如果t到了串尾

2017-12-21 19:52:37 196

原创 376. Wiggle Subsequence

376. Wiggle Subsequence摆动子序列题目:如果一个序列满足num1num3num5或者num1>num2num4此题是给定一个数组,求该数组的最长摆动子序列的长度。解题思路:贪心算法。维护两个变量p和q,如果nums[i]>nums[i-1],p=q+1;否则nums[i]返回的结果是min(nums.length,max(p

2017-12-18 22:45:48 136

原创 377. Combination Sum IV

377. Combination Sum IV组合和04题目:给定一个数组nums,里面没有重复元素;以及一个目标数target,求用nums里面的数加和得到target的组合情况一共有多少种。解题思路:动态规划。定义dp[i]为目标数target为i时,不同组合的个数。然后我们遍历nums,对于nums中的每一个数a,如果a代码:class

2017-12-16 22:25:56 131

原创 375. Guess Number Higher or Lower II

375. Guess Number Higher or Lower II猜数字大小02题目:给定一个数字n,我首先在1-n之间选择一个数字,然后由你去猜这个数字是几,如果你猜错了,我会提示你你的答案比真实答案高了还是低了,直到猜中。在每次猜错时,你都需支付一定的费用,这个费用就是你猜错的数字的大小。问如果能保证赢,至少要支付多少钱。解题思路:动态规划。

2017-12-16 22:23:57 205

原创 363. Max Sum of Rectangle No Larger Than K

363. Max Sum of Rectangle No Larger Than K最大矩形和不超过k题目:给定一个矩阵matrix和一个整数k,求元素加和不超过k的最大子矩形。解题思路:动态规划。我们使用暴力搜索。定义sum[i][j]为矩形(0,0)-(i,j)的和;然后我们遍历这个矩形中的所有的子矩形,计算它与k的大小,并更新结果。代码:

2017-12-16 22:23:10 248

原创 354. Russian Doll Envelopes

354. Russian Doll Envelopes俄罗斯套娃信件题目:给定一个二维数组,每一行[w,h]代表一封信的[长、宽],如果我们像俄罗斯套娃那样套起来(外面的长和宽同时小于里面的长和宽),问一共可以套几封。解题思路:动态规划。定义dp[i]为到第i个信封为止,最多可以有多少个信封。1、首先我们将数组中的所有信件进行排序:先按照宽由小到大的

2017-12-16 22:22:01 180

原创 309. Best Time to Buy and Sell Stock with Cooldown

309. Best Time to Buy and Sell Stock with Cooldown含有冷冻期的买卖股票的最佳时期题目:给定一个数组,代表每天股票的价格,你可以交易任意次,但必须遵循以下规则:①必须在下一次买之前先卖出去;②卖出股票的第二天为冷冻期,不能接着买股票解题思路:buy[i]表示在第i天之前最后一个操作是买,此时的最大收益。

2017-12-16 22:20:20 264

原创 304. Range Sum Query 2D - Immutable

304.Range Sum Query 2D - Immutable二维区域和检索题目:给定一个二维数组matrix[][],以及两个坐标点(row1,col1)(row2,col2),求由两个坐标点围成的矩形区域中的元素之和。解题思路:利用动态规划的思想。定义dp[i][j]为区间(0,0)-(i,j)这个矩形区域中的所有元素之和。dp[n+1

2017-12-16 22:19:18 177

原创 312. Burst Balloons

312. Burst Balloons打气球题目:打气球的游戏,每个气球都对应着一个数字,每次打爆一个气球,得到的金币数是被打爆的气球的数字和其两边的气球上的数字相乘,如果旁边没有气球了,则按1算,以此类推,求能得到的最多金币数。解题思路:使用动态规划。dp[i][j]表示打爆区间[i,j]中的所有气球能得到的最多金币。

2017-12-16 22:17:47 186

原创 322. Coin Change

322. Coin Change硬币交换题目:给定一个数组,代表可用的硬币的面值,和一个钱数,问我们最小可以用多少个硬币来找零。如果不可以找零,则返回-1。解题思路:动态规划。定义dp[i]为钱数为i时,至少需要多少个硬币。dp[i]=min(dp[i],dp[i-coins[j]]+1)注意,要对dp[i]进行初始化为amount+1.

2017-12-16 22:15:58 322

转载 如何进行特征选择

如何进行特征选择原文地址:http://blog.csdn.net/u010670689/article/details/73196546特征选择对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练

2017-12-15 14:59:56 21914 1

原创 k-means算法、性能及优化

k-means算法、性能及优化一、k-means算法简介k-means是用来解决著名的聚类问题的最简单的非监督学习算法之一。该过程遵循一个简易的方式,将一组数据划分为预先设定好的k个簇。其主要思想是为每个簇定义一个质心。设置这些质心需要一些技巧,因为不同的位置会产生不同的聚类结果。因此,较好的选择是使它们互相之间尽可能远。接下来将数据中的每个点归类为距它最近的质心,距离的计

2017-12-14 16:31:15 15575 5

转载 机器学习性能优化方法

原文地址:http://blog.csdn.net/han_xiaoyang/article/details/53453145机器学习最有价值(实际应用最广)的部分是预测性建模。也就是在历史数据上进行训练,在新数据上做出预测。 而预测性建模的首要问题是:如何才能获得更好的结果?为此,我们整理了一份备忘清单,用于提升机器学习算法的性能。该清单主要分为以下4个子主题:①基于数据改善性能②借

2017-12-14 10:12:43 807

信息处理课程设计

中国矿业大学《信息处理课程设计》题目汇总

2015-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除