自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

moluchase的专栏

海阔凭鱼跃,天高任鸟飞

  • 博客(299)
  • 问答 (1)
  • 收藏
  • 关注

转载 线性回归 最小二乘法 方差

线性回归定义:    在上一个主题中,也是一个与回归相关的,不过上一节更侧重于梯度这个概念,这一节更侧重于回归本身与偏差和方差的概念。    回归最简单的定义是,给出一个点集D,用一个函数去拟合这个点集,并且使得点集与拟合函数间的误差最小。       上图所示,给出一个点集(x,y), 需要用一个函数去拟合这个点集,蓝色的点是点集中的点,而红色的曲线是函数的曲线,第一

2017-11-25 14:35:49 12376

原创 mac安装LightGBM with Anaconda

网上很多安装教程有误,或者是太老???不如直接看官网教程参考官网 https://github.com/Microsoft/LightGBM/blob/master/docs/Installation-Guide.rst#osx https://github.com/Microsoft/LightGBM/tree/master/python-packageL

2017-11-25 08:47:06 6044 4

原创 关于np.newaxis的一点理解

经常在sklearn上看到np.newaxis,这里记录一下我的理解np.arange(0, 10)这句话 生成的是一个一维的数组,如下:[0 1 2 3 4 5 6 7 8 9]输出其shape:(10,)那么我如何才能将其转化为shape=(1,10)呢可以用两种方法:1.使用shapey=np.arange(1, 11)y.shape=(10,1)prin

2017-11-23 22:29:28 38084 5

转载 正则化方法:L1和L2 regularization、数据集扩增、dropout

转载:http://blog.csdn.net/u012162613/article/details/44261657本文是《Neural networks and deep learning》概览 中第三章的一部分,讲机器学习/深度学习算法中常用的正则化方法。(本文会不断补充)正则化方法:防止过拟合,提高泛化能力在训练数据不够多时,或者overtraining

2017-11-09 21:34:42 424

转载 在mac上安装Xgboost Python库

转载:http://blog.csdn.net/u014365862/article/details/73739857最近在mac上用到xgboost库,安装时遇到颇多大坑,网上查了很多答案几乎都是win上的问题,没遇到理想的,自己也就摸着石头把几个大坑给填了,总结一下,给后人少走点弯路。1.错误倘若直接 pip install xgboost时,会出现Command

2017-10-31 10:39:25 391

转载 百度离职总结:如何做个好员工?

转载:http://blog.csdn.net/jasonding1354/article/details/38057247#comments2014年7月4日,我从百度离职了。这是第一次,我不是因为和老板闹翻而离职;这是第一次,我带着晋升的喜悦而离职;这是第一次,我带着满满的收获而离职。我曾经认为,我永远不会成为一个好员工,因为我太独、太挑剔、不喜

2017-10-26 16:54:43 356

转载 主成分分析(PCA)原理及推导

转载:http://blog.csdn.net/zhongkejingwang/article/details/42264479什么是PCA?  在数据挖掘或者图像处理等领域经常会用到主成分分析,这样做的好处是使要分析的数据的维度降低了,但是数据的主要信息还能保留下来,并且,这些变换后的维两两不相关!至于为什么?那就接着往下看。在本文中,将会很详细的解答这些问题:PCA、S

2017-10-26 15:02:27 3130

转载 统计学习方法——CART, Bagging, Random Forest, Boosting

转载:http://blog.csdn.net/abcjennifer/article/details/8164315本文从统计学角度讲解了CART(Classification And Regression Tree), Bagging(bootstrap aggregation), Random Forest Boosting四种分类器的特点与分类方法,参考材料为密歇根大学Ji

2017-10-24 19:34:58 330

转载 总结:Bias(偏差),Error(误差),Variance(方差)及CV(交叉验证)

转载:http://blog.csdn.net/MrLevo520/article/details/53128297前言此片有很多别人的东西,直接搬过来了,都有注释,里面也有一些自己的理解和需要注意的地方,以此记录一下,总结如下,思想不够成熟,以后再补充,如有错误请不吝指正犀利的开头在机器学习中,我们用训练数据集去训练(学习)一个model(模型),

2017-10-24 19:05:55 1538

转载 偏差与方差,欠拟合与过拟合

转载:http://blog.csdn.net/hurry0808/article/details/78148756机器学习的核心在于使用学习算法建立模型,对已建立模型的质量的评价方法和指标不少,本文以准确率(也称为精度)或判定系数(Coefficient of Determination)作为性能指标对模型的偏差与方差、欠拟合与过拟合概念进行探讨。偏差、方差、欠拟合、过拟合均

2017-10-24 15:33:34 1482

转载 先别管那些算法了,从实战中开始大数据机器学习(一)

转载:http://www.cnblogs.com/senlinmu/articles/7086382.html概述我从去年8月份开始接触机器学习。简单的讲下我的这段经历:首先是斯坦福大学的吴恩达的机器学习;学会了一些原理,但在学习的过程中不断触碰到微积分,而微积分的相关知识早已全部忘记,然后转头去学习微积分。微积分看的是麻省理工的Gilbert

2017-10-21 15:29:09 666

转载 Comprehensive learning path – Data Science in Python

转载:https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-data-science-python/Journey from a Python noob to a Kaggler on

2017-10-19 20:38:50 366

转载 关于ROC和AUE

什么是AUEAUC是指 随机给定一个正样本和一个负样本,分类器输出的正样本的概率 比 分类器出去负样本的概率 大的可能性先参看下面两个回答:https://www.zhihu.com/question/39840928?from=profile_question_card李大猫讲关于什么是AUE部分下面这个比较好理解:作者:无涯链接:https://ww

2017-10-19 16:46:51 925

转载 GBDT 入门教程之原理、所解决的问题、应用场景讲解

转载:https://toutiao.io/posts/u52t61/previewGBDT (Gradient Boosting Decision Tree) 又叫 MART (Multiple  Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(gener

2017-09-27 11:34:40 11617 2

原创 Python爬取网页转为PDF

爬虫的起因官方文档或手册虽然可以查阅,但是如果变成纸质版的岂不是更容易翻阅与记忆。如果简单的复制粘贴,不知道何时能够完成。于是便开始想着将Android的官方手册爬下来。 全篇的实现思路分析网页学会使用BeautifulSoup库爬取并导出参考资料: * 把廖雪峰的教程转换为PDF电子书 * Requests文档 * Beautiful Soup文档配置在Ubuntu下使用Pycha

2017-08-23 17:01:12 4732

原创 Android中的Intent

date: 2017-05-04 14:52:45基本用例启动ActivityActivity表示应用的一个屏幕,通过将Intent传递给startActivity(),可以启动新的Activity实例,同时将Intent携带的数据传给新的Activity。如果希望在新的Activity关闭后,返回给原先的Activity数据,需要使用startActivityForResult(),同时在原先的A

2017-08-23 16:55:25 297

原创 Lua学习笔记

Lua学习笔记 见http://www.runoob.com/lua/lua-tutorial.html 注释– 表示单行注释–[[ 多行注释 –]]标识符同C,不能以数字开头,区分大小写,最好不要使用下划线加大写字母的标识符全局变量如果不存在,则输出nil,如果想删除一个全局变量,只用使用nil将其赋值(默认情况下变量总是全局变量),nil表示变量不存在Lua数据类型nil 表示一个无效值

2017-08-23 16:52:53 294

转载 大数据经典学习路线(及供参考)

参考:http://blog.csdn.net/yuexianchang/article/details/524682911.Linux基础和分布式集群技术学完此阶段可掌握的核心能力:熟练使用linux,熟练安装Linux上的软件,了解熟悉负载均衡、高可靠等集群相关概念,搭建互联网高并发、高可靠的服务架构;学完此阶段可解决的现实问题:

2017-08-22 10:49:01 390

原创 将Django项目搭建到服务器上

参考http://code.ziqiangxuetang.com/django/django-deploy.html服务器是Ubuntu系统,其实按照上面的教程正常情况很快就能搭建成功,但是有时候就是不正常。。。没办法,各种报错下面一步一步道来:在服务器上搭建Django和本机上是一样的搭建Django环境这里我是下载好Django安装包,然后传到服务器上的(服务器上下载巨慢),然后使用下面语句ta

2017-08-18 19:39:37 1203

原创 机器学习实战笔记4

第七章 AdaBoostadaBoost算法见统计学习方法P138下面讲一下机器学习实战中的代码:首先是求出当层最小误分率,这里用到的是决策树生成函数(其实统计学习方法中一直不明白到底是怎么获取基本分类器的,而且给出的例子维度还是1维的,应该说是就没看懂AdaBoost)训练集如下矩阵所示: ⎡⎣⎢⎢⎢⎢⎢x(1)1x(1)2.x(1)Nx(2)1x(2)2.x(2)N............x

2017-08-15 20:41:51 317

原创 机器学习实战笔记3

第6章 SVM支持向量机是一种二分类模型,其基本模型是定义在特征空间上间隔最大的线性分类器,间隔最大使它有别于感知机;其核技巧使其成为非线性分类器函数间隔:定义超平面(w,b)关于样本点(xi,yi)(x_{i},y_{i})的函数间隔为γi^=yi(w∗xi+b)\hat{\gamma_{i}}=y_{i}(w*x_{i}+b)几何间隔:可以理解成点到面的距离,不会因为w,b的集体变化而变化(w,

2017-08-15 20:39:35 267

原创 机器学习实战笔记2

第5章 Logistic回归原理【实质和感知机有点像】———————-补充:感知机————————-定义给定一个数据集:T={(x1,y1),(x2,y2),…,(xN,yN)}T=\left\{{(x_{1},y_{1}),(x_{2},y_{2}),…,(x_{N},y_{N})}\right\} , 其中xiϵRn,yiϵ{+1,−1},i=1,2,…Nx_{i}\epsilon R^{n}

2017-08-15 20:36:41 319

原创 机器学习实战笔记1

机器学习实战&统计学习方法前两部分主要讨论监督学习(只需要给定输入样本集,机器就可以从中推演出指定目标变量的可能结果)第一部分 分类目标变量(也叫类别):一般为标称型(在限定的目标集中取值,离散有限型,一般是分类算法)和数值型(无限的数值集合中取值,连续型,一般是回归算法) 特征:属性第1章机器学习基础机器学习的主要任务监督学习:分类,回归。[k-近邻,朴素贝斯,svm,决策树,等] 无监督学习

2017-08-15 11:37:46 502

转载 Mac中安装tar包的Mysql服务

转载于:http://blog.csdn.net/u014057054/article/details/52070390完整操作步骤下载MySQL安装包地址:http://dev.mysql.com/downloads/mysql/找到下载的 MySQL tar.gz 文件位置, 浏览器下载的一般在当前用户的 Downloads 目录, 即 /Users//Down

2017-08-08 23:30:55 769

原创 MAC 安装Scrapy

现状自带python2.7 ,又安装了python3.6,可以使用pip3,而pip不能使用安装使用 pip3 install ScrapyCollecting Scrapy  Using cached Scrapy-1.4.0-py2.py3-none-any.whlCollecting cssselect>=0.9 (from Scrapy)

2017-07-24 09:10:36 709

转载 Python 字典items返回列表,iteritems返回迭代器

字典items()方法和iteritems()方法,是python字典的内建函数,分别会返回Python列表和迭代器,下面一起来看下字典items()和iteritems()的具体操作方法。作用python字典的items方法作用:是可以将字典中的所有项,以列表方式返回。如果对字典项的概念不理解,可以查看Python映射类型字典基础知识一文。因为字典是无序的,所以用items方法返

2017-07-16 09:44:10 765

原创 Titanic问题学习

我的第一篇写机器学习的博客目前水平:只是花了三个星期把统计学习方法看完推导了一遍目的:仅仅是想着熟悉一下统计学习方法中算法的用处,了解机器学习的一些比赛,更好的明白学习的方向结果:熟悉了数据的处理与分析流程,如何分离特征,但是关于调参数及优化这块没学习到感想:理论和实践还是差距很大的,明显自己完成这些比赛还需要一些过渡,否则很难往前走;需要看机器学习的一些实战的书kaggle官

2017-07-02 20:26:28 353

转载 使用Pandas对数据进行筛选和排序

转载:“蓝鲸网站分析博客”http://bluewhale.cc/2016-08-06/use-pandas-filter-and-sort.html首选导入需要使用的Pandas库和numpy库,读取并创建数据表,将数据表命名为lc。import pandas as pdimport numpy as nplc=pd.DataFrame(pd.read_csv('Lo

2017-07-02 17:07:09 6066

转载 python中绘图中文乱码问题

转载 http://www.th7.cn/Program/Python/201610/995260.shtml对于label 使用plt.legend(prop=zhfont1)对于title等一般而言,使用plt.xlabel('性别',fontproperties=zhfont1)原文Matplotlib是Python的一个很好的绘图包,但是

2017-06-30 14:48:51 3693

转载 Bumpy数组切片

多维数组和一维数组的存取方法类似,我们这篇文章介绍使用切片来存取一个二维数组,多维数组道理一样,你自己尝试一下即可。先从numpy中引入所有创建一个一维数组将一维数组重新组织成一个二维数组使用切片来读取第一行中的第二和第三个数,我们看下标【0,2:4】,其中逗号前的数字表示第0轴下标取值范围,逗号之后表示第1维下标取值范围,2:4就表示2-4之间

2017-06-30 10:30:20 230

转载 Python中的Numpy数组

转载:http://blog.csdn.net/sunny2038/article/details/9002531NumPy数组NumPy数组是一个多维数组对象,称为ndarray。其由两部分组成:实际的数据描述这些数据的元数据大部分操作仅针对于元数据,而不改变底层实际的数据。关于NumPy数组有几点必需了解的:NumPy数组的下标从0开始。同一

2017-06-30 10:13:47 1100

转载 Pycharm如何添加第三方库和插件

见http://www.cnblogs.com/Bingosay/p/4917374.html Pycharm是我比较喜欢的一款编辑器。  学习python有半年左右,安装第三方库都是通过 pip install 或者 easy_install。每次都要打开命令行感觉太麻烦。还好Pycharm提供了安装第三方库和安装插件的功能。   首先打开Pycharm,点击

2017-06-26 17:25:01 48925 2

转载 ubuntu下安装与测试mysql

1.在决定安装MySQL之前,要先确定系统是否已经安装mysql。 输入:1mysql结果:说明尚未安装mysqlThe program 'mysql' is currently notinstalled. Youcan install it by typing:sudo apt

2017-06-19 09:39:41 646

转载 Android 浏览网页:WebView 嵌入浏览器(浏览历史返回、自定义加载失败界面、支持缩放、获取标题栏)

参考:http://blog.csdn.net/danfengw/article/details/48369137一、WebView简介  在 Android 手机中内置了一款高性能 webkit 内核浏览器,在 SDK 中封装为一个叫做 WebView 组件.我们可以通过对它的美化和包装在自己的应用程序里嵌入一个浏览器。二、WebView在应用中加载网

2017-05-24 21:26:33 426

转载 Android中的WebView进行直接加载网页

http://blog.csdn.net/developer_jiangqq/article/details/7054762 我们都知道Android的网络功能很不错,当然Android中WebView组件也挺不错,可以直接进行加载网页,我们可以把这个看做一个小型的浏览器\      【注】以下的一些内容我翻译了一下文档,可能有些翻译不太准确,就算自己当做一次学习英

2017-05-24 21:24:26 613

转载 Lua字符串模式匹配函数小结

http://www.jb51.net/article/57631.htmtonumber()tostring()模式匹配函数在string库中功能最强大的函数是:复制代码代码如下:string.find(字符串查找)string.gsub(全局字符串替换)string.gfind(全局字符串查找)string.gmatch(

2017-05-24 10:09:19 1152

原创 关于堆

最小堆的用处优先队列参考:http://www.cnblogs.com/luoxn28/p/5616101.htmlhttp://www.cnblogs.com/CarpenterLee/p/5488070.html查找中位数的一种解法http://www.cnblogs.com/lienhua34/archive/2011/12/06/2381299.html

2017-05-15 15:21:09 217

原创 关于尾递归

尾递归的定义是:当递归调用是整个函数体中最后执行的语句且它的返回值不属于表达式的一部分时,这个递归调用就是尾递归具体参考按顺序看http://blog.csdn.net/fall221/article/details/9156753http://blog.zhaojie.me/2009/03/tail-recursion-and-continuation.htmlhtt

2017-05-15 15:16:01 400

转载 ubuntu下搜狗输入法的输入框只显示英文不显示中文的问题

我把原来的sogou拼音卸载之后就全部出问题了,系统设置的文本输入也显示不了解决方案: 首先强制更新,把依赖文件全部安装sudo apt-get install -f这之后仍然是不管用,于是,继续度娘,发现原来是搜狗默认的配置出了问题,见如下操作即可完成问题(1)Ubuntu下,搜狗拼音输入法能启动(系统托盘处有图标),但是打不出汉字,打字时选框不正常。或者

2017-04-24 10:01:52 1268

原创 Python 返回函数

关于返回函数即返回值为函数详见http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431835236741e42daf5af6514f1a8917b8aaadff31bf000#0关于闭包:是引用了自由变量的函数,这个被引用的自由变量将和这个函数一同存在,即使已经

2017-04-08 15:46:53 462

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除