自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 资源 (2)
  • 收藏
  • 关注

转载 java设计模式---代理模式

java设计模式–代理模式

2021-07-27 11:24:09 202

原创 LASSO回归、岭回归和elastic回归

lasso和岭回归分别是在损失函数上加上L1正则项和L2正则项Elasticnet回归叫做弹性网络回归,同时结合了以上两种正则项Sklearn库中有sklearn.linear_model.ElasticNetCV和sklearn.linear_model.ElasticNet两个函数可供选择,前者可以通过迭代选择最佳的 λ 1 \lambda_1λ1​和λ 2 \lambda_2λ2​(当然你可以指定一组值),后者需要你指定λ 1 \lambda_1λ1​和λ 2 \lambda

2021-07-20 09:37:10 423

原创 二叉树的两种遍历方式

# 二叉树的遍历可分为两种'''1.广度优先遍历分层把元素放到 队列中,进行遍历2.深度优先遍历前序,中序,后序遍历,使用堆栈和递归的方式'''# 广度优先遍历一颗二叉树def bfsTree(self): if sele.root =None: return None queue =[] queue.append(self.root) while queue: node=queue.pop(0) print(node.element,end =',') if.

2021-07-14 18:07:02 463

转载 二叉树的基础知识

二叉树

2021-07-14 17:10:33 92

原创 贪婪算法的集合覆盖问题

#贪婪算法 以寻找局部最优解来找全局最优解,是一种近似算法,基于集合# 广播台分别覆盖的州stations = {}stations["kone"] = set(["id", "nv", "ut"])stations["ktwo"] = set(["wa", "id", "mt"])stations["kthree"] = set(["or", "nv", "ca"])stations["kfour"] = set(["nv", "ut"])stations["kfive"] = set([

2021-07-14 16:29:40 222

原创 迪克斯特拉算法python有向无环图

#迪克斯特拉算法#处理有向无环图,在加权途中寻找最短路径,不能将狄克斯特拉算法用于包含负权边的图#查询消费最小的节点def find_lowst_node(costs,process): lowest_cost = float('inf') lowest_cost_node = None for node in costs: cost = costs[node] if cost<lowest_cost and node not in process: lowest_co

2021-07-14 15:55:42 421

原创 广度优先搜索bfs

# 广度优先搜索 bfs#图的查找方法,可回答两种问题1.从A出发有前往B的路径吗?2.从A前往B的最短路径是哪条?# 寻找朋友中以m结尾的人from collections import deque# who is the person def whoperson(name): return name[-1] ='m' # bfs # deque是一个双向链表,提供了两端都可以操作的序列 def bfs(graph,name): search_queue =deque() s

2021-07-14 15:33:58 96

原创 二分查找,选择排序,快速排序,归并排序,冒泡排序

# 二分查找 平均时间复杂度logndef bianryfind(list,item): low =0; high= len(list)-1 while low <= high: mid = int((low+high)/2) guess= list[mid] if guess == item: return guess else if guess>item: high = mid-1 else: low =mid+1 return None

2021-07-14 14:45:03 106

转载 标准化/归一化方法

sklearn 的preprocessing提供了可以满足需求的归一化方法。1.standardScalar标准化数据通过减去均值然后除以方差(标准差),这种标准化方法经过处理后,数据符合标准正态分布,即均值为0,标准差为1.适用于,数据的分布本来就符合正态分布 x =(x - ?)/?。通常这种方法基本可用于有outlier的情况,但是,在计算方差和均值的时候outliers仍然会影响计算。所以,在出现outliers的情况下可能会出现转换后的数的不同feature分布完全不同的情况。2.min

2021-07-13 18:04:38 1222

原创 pandas求偏度skew

偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。偏度(Skewness)亦称偏态、偏态系数。表征概率分布密度曲线相对于平均值不对称程度的特征数。直观看来就是密度函数曲线尾部的相对长度。定义上偏度是样本的三阶标准化矩:DataFrame.skew(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)参数:axis : {index (0), columns (1)}定义计算

2021-07-13 17:13:32 1759

转载 xgboost的详细讲解

这是目前为止看到最清晰讲解了,推到步骤很有逻辑性

2021-07-12 21:00:13 215

转载 离散型特征的编码方式one-hot编码

转自one-hot 编码pandas 对one-hot编码的函数为:pd.getdummies()sklearn中的one-hot编码;sklearn中的不同编码方式one -hot编码又称为有效一位编码,主要由N位状态寄存器对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,只有一位有效。one-hot编码是分类变量作为二进制向量的表示,首先要求分类值映射到整数值,然后每个整数值表示为二进制向量,除了整数索引之外,都是零值,其他被标志为1....

2021-07-12 14:27:44 369

转载 BOX-COX变换

box-cox变换是统计建模中的一项常用变换。即方差稳定变换。用于连续的因变量不满足正态分布的情况。先说一下泊松分布:泊松分布是一种重尾分布,它的方差等于均值。因此均值越大,方差就越大,重尾程度就越大,,box-cox可以改变变量的分布,使得方差不再依赖于均值。例如:假设随机变量X符合泊松分布,如果通过他的平方根对它进行变换,则X’ =根号x 的方差就接近于一个常数,而不与均值相等。box-cox的变换一般形式为:式中为经Box-Cox变换后得到的新变量,y为原始连续因变量,为变换参数。以

2021-07-12 12:10:23 11856

原创 python中的shape[0]和shape[1]

import numpy as npk = np.matrix([[1, 2, 3, 4,6],[5, 6, 7, 8,9],[9, 10, 11, 12,13]])print(np.shape(k)) # 输出(3,5)表示矩阵为3行5列print(k.shape[0]) # shape[0]输出3,为矩阵的行数print(k.shape[1]) # 同理shape[1]输出列数5...

2021-07-12 10:35:22 4643

原创 费曼算法是什么

其步骤如下。(1) 将问题写下来。(2) 好好思考。(3) 将答案写下来。

2021-06-04 16:31:09 401

原创 Axure动作总结

Axure动作总结:(1)LINKSopen link / current window : 当前页打开页面或外部urlopen link/new window/tab: 新窗口打开页面或外部urlopen link / popup window : 弹出窗口打开页面或urlopen link /parent window :在parent window 里打开页面或urlclose window :关闭当前窗口open link in frame /inline frame : 在fra

2021-04-22 01:00:35 851

原创 Axure事件总结

Axure事件总结onClick-鼠标点击时触发onMouseEnter - 鼠标进入部件区域时触发onMouseOut - 鼠标移出部件区域时触发onDoubleClick - 双击时触发onContextMenu - 在部件点击右键时触发onMouseDown - 鼠标键按下时触发,注意和点击的区别,点击是松开了之后才触发onMouseUp - 鼠标键抬起时触发onMouseMove - 鼠标在部件范围内移动时触发onMouseHover - 鼠标在部件上悬停一段时间后触发onLo

2021-04-20 23:41:27 1239

原创 索引的应用场景

什么时候不要用索引,什么时候要用索引(1)什么场景不要用索引:1>数据更新性能比查询性能要求要高的情况下不要使用索引,因为数据的更新的同时索引也要进行维护和更新(加了索引查询快但更新就会慢);2>不要盲目的给表建太多索引,因为索引本身的存储也要占用存储空间,一旦更新操作频繁反而降低新性能;3>不要给不经常使用的列建索引,不怎么查询还建索引干嘛;4>不要给高重复值的列建索引,索引本身就是为了提高查询速度,然而数据值高度重复,数据区别性不高,索引起不了效果)(比如说:性别);

2021-01-14 16:46:53 2137 1

转载 推荐系统万字长文

推荐系统万字长文

2020-10-16 15:02:32 143

原创 人间四月天

转眼间,人间四月至,芳菲尽,却还残留着冬天的些许寒气,不能让人尽情享受这春光无限。我也一样,新一年立下的flag也迟迟没有启动,像一个被滞留在冬天的大树,虽孕育新生,但看上去却依然干枯。 我做事可能真的有点三分钟热度,上班一年就想辞职,上班3天就想休息,上班8小时就想下班,喝不了鸡汤,迎合不了领导,经不起无聊扯淡,受不了敷衍,就这样,可能真的成不了一个合格听话的员工,其实自己也是比较煎熬痛苦的...

2020-04-01 16:18:21 220

转载 Oracle job procedure 存储过程定时任务

Oracle job procedure 存储过程定时任务

2019-06-25 15:03:59 291

原创 java builder模式

java builder模式主要是用一个内部类去实例化一个对象,避免一个类出现多个构造函数,并且构造函数如果出现默认参数,就比较容易出错。不直接生成想要的对象,而是让客户端利用所有必要的参数调用构造器,得到一个builder对象,然后客户端在builder对象上调用类似于setter的方法,来设置每个相关的可选参数,最后客户端调用无参数的build方法来生成不可变的对象。public clas...

2019-03-21 15:57:42 272

转载 Kibana客户端 DSL查询与过滤

Kibana客户端 DSL查询与过滤

2019-03-14 17:43:31 2200

转载 mybatis动态创建表

转自:https://www.cnblogs.com/Joanna-Yan/p/9187538.html 项目中业务需求的不同,有时候我们需要动态操作数据表(如:动态建表、操作表字段等)。常见的我们会把日志、设备实时位置信息等存入数据表,并且以一定时间段生成一个表来存储,log_201806、log_201807等。在这里我们用MyBatis实现,会用到动态SQL。动态SQL是Mybatis的...

2019-03-06 15:10:46 15632 7

转载 Kaggle爆文:一个框架解决几乎所有机器学习问题

转自https://blog.csdn.net/gh13uy2ql0N5/article/details/78293745

2019-01-24 14:43:34 320

转载 决策树--信息增益,信息增益比,Geni指数的理解

转自:https://www.cnblogs.com/muzixi/p/6566803.html决策树 是表示基于特征对实例进行分类的树形结构      从给定的训练数据集中,依据特征选择的准则,递归的选择最优划分特征,并根据此特征将训练数据进行分割,使得各子数据集有一个最好的分类的过程。 决策树算法3要素: 特征选择 决策树生成 决策树剪枝  部分理解:...

2019-01-18 15:18:33 1815

转载 【集成学习】sklearn中xgboost模块的XGBClassifier函数

转自:https://www.cnblogs.com/pengwang52/p/9623093.html# 常规参数booster gbtree 树模型做为基分类器(默认) gbliner 线性模型做为基分类器 silent silent=0时,不输出中间过程(默认) silent=1时,输出中间过程 nthread nthread=-1时,使用全部CPU进行并...

2019-01-18 10:10:27 1214

转载 超全的机器学习&深度学习资料汇总,惠存!

转自:http://blog.sina.com.cn/s/blog_53a510ad0102vl7o.html

2018-12-22 12:22:02 376

原创 批量合并TXT文件为一个文件

import importlib,sysimportlib.reload(sys)import osimport os.pathimport timetime1=time.time()##########################合并同一个文件夹下多个txt################def MergeTxt(filepath,outfile): k = open(fi...

2018-12-20 11:51:52 1298 1

原创 python3 reload(sys)错误提示

python2.x中:import sys reload(sys) sys.setdefaultencoding(‘utf-8’) python3.x中:import importlib,sys importlib.reload(sys)

2018-12-20 11:49:16 13420 2

转载 关于Maven项目build时出现No compiler is provided in this environment的处理

关于Maven项目build时出现No compiler is provided in this environment的处理很详细,很有效,赞

2018-10-15 15:44:48 413

转载 解决Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.1:compile (default-compile

解决Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.1:compile (default-compile) on project autotest_fchtgl: Compilation failure的方法https://www.cnblogs.com/shenrong/p/7129210.html...

2018-10-15 15:40:42 2919

转载 RESTful API规范(详细版)

Restful规范:https://www.colabug.com/228298.html

2018-10-15 10:47:46 2160

转载 windows控制台cmd中文输出乱码

这篇文章让问题马上得到了解决,很实用。。。。windows控制台cmd中文输出乱码

2018-10-11 09:06:16 4959

原创 数据结构--树

(1)树的简介 树是一种非线性数据结构,是由n(n&gt;=0)的结点组成的有限集合。 当n==0时,为空树 当n&gt;0,树包含根节点和子树,根节点只有后继没有前驱。 ...

2018-07-27 10:06:51 165

转载 机器学习算法汇总

机器学习算法汇总

2018-07-25 11:19:22 648

原创 搜索引擎算法

搜索引擎算法调研

2018-07-25 11:14:52 1832

原创 CTR常用算法

广告点击率预估常用算法

2018-07-25 10:56:59 3879

原创 NLP算法和工具汇总

自然语言处理的算法和工具汇总

2018-07-25 10:54:01 2481 34

原创 优化算法总结

机器学习模型优化常用优化算法总结

2018-07-25 10:51:02 232

研究生能力提高与科学研究探索

指导研究生的科研方法和学习方法,指明研究生科学研究探索应有的素质和品质

2015-05-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除