自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (5)
  • 收藏
  • 关注

转载 链表及常见算法题

作为线性表的两种存储方式 —— 链表和数组,这对相爱相杀的好基友有着各自的优缺点。接下来,我们梳理一下这两种方式。数组,所有元素都连续的存储于一段内存中,且每个元素占用的内存大小相同。这使得数组具备了通过下标快速访问数据的能力。但连续存储的缺点也很明显,增加容量,增删元素的成本很高,时间复杂度均为 O(n)。增加数组容量需要先申请一块新的内存,然后复制原有的元素。如果需要的话,可能还要删除原先的内存。删除元素时需要移动被删除元素之后的所有元素以保证所有元素是连续的。增加元素时需要移动指定位置及之后

2021-01-04 19:18:00 166

转载 HDFS节点详解 Google三大论文之一的GFS

设计思想分而治之:将大文件、大批量文件,分布式放在大量服务器上,以便于采取分而治之的方式对海量数据进行预算分析;在大数据系统中的作用:为各类分布式运算框架(如:MapReduce,Spark等)提供数据存储服务重要概念:文件切块,副本存放,元数据HDFS架构HDFS各节点NameNode是HDFS的主节点,负责元数据的管理以及客户端对文件的访问。管理数据块的复制,它周期性地从集群中的每个DataNode接收心跳信号和块状态报告(Blockreport)DataNode是HDFS的从节点

2020-11-09 19:06:12 775

原创 windows10 热点一直显示正在断开中

windows10 热点一直显示正在断开中解决方法:Windows+x,打开“windows Powershell(管理员),执行以下命令:netsh winsock reset重启电脑,就OK了

2020-09-13 13:04:42 3445 2

原创 剑指offer

这里写自定义目录标题输入输出练习面试题4 二维数组中的查找面试题5 替换空格面试题6 从尾到头打印链表面试题7 重建二叉树面试题8 二叉树的下一个节点面试题9 用两个栈实现队列面试题10 斐波那契数列跳台阶**变态跳台阶**矩形覆盖面试题11 旋转数组的最小数字面试题15 二进制中1的个数面试题16 数值的整数次幂---待看面试题21 调整数组顺序使奇数位于偶数前面面试题22 链表中倒数第k个节点面试题24 翻转链表面试题25 合并两个排序的链表面试题26 树的子结构面试题27 二叉树的镜像面试题28 对称

2020-09-03 18:38:46 173

原创 Mysql安装常见问题汇总

完美解决Mysql彻底安装并重装mysql完全卸载教程(图文详细)MySQL 5.7.29 解压版 安装教程(windows)mysql配置时,提示:Failed to start service MYSQL80在MySQL登录时出现Access denied for user ‘root’@‘localhost’ (using password: YES) 拒绝访问,并可修改MySQL密码...

2020-07-02 21:15:02 127

原创 某公司笔试编程题

前k个最小数#python版本class Solution: def GetLeastNumbers_Solution(self, input, k): n = len(input) if k<=0 or k>n: return #对input中前k个数建立大根堆, input从0开始,即input[0:k-1] 为一个大根堆 for i in range(int(k/2), -1, -1):.

2020-06-17 22:28:35 156

原创 精确率、召回率、F1-score、准确率、AUC、ROC曲线?

查准率、查全率又是精确率(precision)、召回率(recall)F1度量,F1-score 越高,说明分类模型越稳健准确率(accuracy) = (TP+TN)/(TP+FN+FP+TN)A把C全部包住,A优于C。与 P-R 曲线使用查准率、查全率为纵、横轴不同, ROC 曲线的纵轴是"真正例率" (True Positive Rate,简称 TPR),横轴是"假正例率" (False Positive Rate,简称 FPR) ,基于表 2.1 中的符号,两者分别定义为:..

2020-05-15 18:54:55 883

原创 Spark系列教程——1基础预习

本教程为即学即用Spark实战44讲的系列课程,本部分为前言和模块一。前言spark诞生于2009年,适合数据科学家与数据分析师进行中小规模数据处理,多语言接口与 SQL 支持让它赢得了很多分析师用户。spark官方定义:一个通用的快速分析引擎。(通用:供所有大数据从业人员使用;分析:主要面向数据处理场景)spark适合谁学:数据分析爱好者,分析师,大数据工程师,大数据架构师。Spark官方模块一:基础预习1 MapReduce:计算框架和编程模型系统领域两大顶级会议:ODSI,SOSPG

2020-05-09 20:11:25 275

原创 C++中map,unordered_map,pair,make_pair的使用

mapclass Solution {public: vector<int> intersect(vector<int>& nums1, vector<int>& nums2) { //O(nlogn) map<int, int> record; for (int i = 0...

2020-04-26 11:51:46 1904

原创 C++中vector,stack,queue,deque,set最常用函数

vector向量1、函数(1)a.back();//返回a的最后一个元素(2)a.front();//返回a的第一个元素(3)a[i]; //返回a的第i个元素,(4)a.clear();//清空a中的元素(5)a.empty();//判断a是否为空,空则返回ture,不空则返回false(6)a.pop_back();//删除a向量的最后一个元素(7)a.push_back(5)...

2020-04-24 14:09:54 201

原创 C++ stringstream格式化输出输入探索

getline(),可得到一行字符串;cin.getline(s,k);接收一行中k个字符,可以接收空格,cin.getline()实际有三个参数,cin.getline(字符串,接收个数,结束字符);当第三个参数省略时,系统默认为’\0’;\n表示换行符; \0表示字符串结束标识符getline(cin,s);和cin.getline()类似,读入一行字符串,值得注意的是cin...

2020-04-23 17:09:38 603

原创 常用排序汇总

语法简单说明插入排序InsertionSort查找出arr(i)在L[1…i-1]中的插入位置k将arr[k…i-1]中所有元素全部后移一个位置将arr(i)复制到arr(k)void insertionSort( T arr[], int n){ //插入排序 for(int i = 1; i < n; i++){ //插入排序从i= 1开始,因为第一个元...

2020-04-15 11:53:13 133

原创 数据库索引——唯一索引、主键索引、聚集索引

索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。索引的一个主要目的就是加快检索表中数据,亦即能协助信息搜索者尽快的找到符合限制条件的记录ID的辅助数据结构。索引分为聚簇索引和非聚簇索引两种,聚簇索引 是按照数据存放的物理位置为顺序的,而非聚簇索引就不一样了;聚簇索引能提高多行检索的速度,而非聚簇索引对于单行的检索很快。根据数据库的功能,可以在数据库...

2020-04-13 18:45:51 4076

原创 数据库总结

1 SQL逻辑查询语句执行顺序还记得上面给出的那一长串的SQL逻辑查询规则么?那么,到底哪个先执行,哪个后执行呢?现在,我先给出一个查询语句的执行顺序:(7) SELECT(8) DISTINCT <select_list>(1) FROM <left_table>(3) <join_type> JOIN <rig...

2020-04-12 17:59:15 180

原创 支持向量机SVM总结

1 什么是SVM?SVM是Support Vector Machine的简称,它的中文名为支持向量机,属于一种有监督的机器学习算法,可用于离散因变量的分类和连续因变量的预测。通常情况下,该算法相对于其他单一的分类算法(如Logistic回归、决策树、朴素贝叶斯、KNN等)会有更好的预测准确率,主要是因为它可以将低维线性不可分的空间转换为高维的线性可分空间。该算法的思想就是利用某些支持向量所构成...

2020-04-09 16:59:50 466

原创 L0,L1,L2范式的区别?岭回归,Lasso回归

范数规则化有两个作用:1)保证模型尽可能的简单,避免过拟合。2)约束模型特性,加入一些先验知识,例如稀疏、低秩​等。先讨论几个问题:1)实现参数的稀疏有什么好处吗?一个好处是可以简化模型,避免过拟合。因为一个模型中真正重要的参数可能并不多,如果考虑所有的参数起作用,那么可以对训练数据可以预测的很好,但是对测试数据就只能呵呵了。另一个好处是参数变少可以使整个模型获得更好的可解释性。2)参...

2020-04-07 19:58:57 1100

原创 5模型融合(stacking/blending/boosting/bagging)-零基础入门数据挖掘

1 模型融合包含哪些1.1简单加权融合回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean)分类:投票(Voting)综合:排序融合(Rank averaging),log融合1.2 stacking/blending构建多层模型,并利用预测结果再拟合预测1.3 boosting/bagging(在xgboost, Adaboo...

2020-04-04 20:55:50 737

原创 一文读懂决策树(ID3,C4.5,CART),随机森林,GBDT,AdaBoost,XGboost,lightGBM,CatGBM

信息熵经验信息熵条件熵信息增益ID3ID3算法使用信息增益指标实现根节点或中间节点的字段选择,那个属性的信息增益大,选择那个属性作为分隔的节点,但是该指标存在一个非常明显的缺点,即信息增益会偏向于取值较多的字段。C4.5算法信息增益率,C4.5使用HA参考就是在信息增益的基础上进行相应的惩罚。其中,HA为事件A的信息熵。事件A的取值越多,GainA(D)可能越大,但同时...

2020-04-04 20:53:55 1176

原创 4. 模型构建-零基础入门数据挖掘 - 二手车交易价格预测

1. 统计学习分类1.1 监督学习:利用一组带标签的数据, 学习从输入到输出的映射, 然后将新数据用这种映射关系可以得到映射结果, 达到分类或者回归的目的。线性回归、决策树、SVD等1.2 非监督学习输入数据没有被标记,也没有确定的结果。K-means聚类、层次聚类等1.3 半监督学习在实际情况中,获取的数据大部分都是无标签的,人们企图加入一些人为标注的样本,使得无标签的数据通过训练自...

2020-04-01 21:39:47 132

原创 3. 特征工程-零基础入门数据挖掘 - 二手车交易价格预测

1. 常见的特征工程包括:1.1 异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;1.2 特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式: log(1+x/(1+median))1.3 数据分桶:List item等频分桶;等距分桶;...

2020-03-28 18:47:07 101

原创 2.EDA-零基础入门数据挖掘 - 二手车交易价格预测

**赛题链接:**https://tianchi.aliyun.com/competition/entrance/231784/introduction数据读取pd.read_csv('Train_data.csv', sep = ' ') ,sep = ’ '表示内容以空格分隔Train_data.iloc[0:15, 9:20], Train_data.loc[:5, 'name':'b...

2020-03-24 20:22:49 155

原创 242. 有效的字母异位词

242. 有效的字母异位词难度简单给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。示例 1:输入: s = “anagram”, t = “nagaram”输出: true示例 2:输入: s = “rat”, t = “car”输出: false说明:你可以假设字符串只包含小写字母。//利用哈希表class Solution {publi...

2020-02-27 19:44:45 66

原创 1. 两数之和

1. 两数之和难度简单给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1...

2020-02-27 19:39:53 82

即学即用Spark实战44讲范东来模块一.md

自己按照视频讲的整理即学即用Spark实战44讲范东来模块一,详细内容参考链接https://kaiwu.lagou.com/course/courseInfo.htm?courseId=71#/detail/pc?id=1971

2020-05-09

Linux系统管理

目录1.linux基础 2.Ubuntu的安装与配置 3.操作系统接口 4.linux常用命令

2019-02-27

基于BS的家具管理系统的设计与实现

基于BS的家具管理系统的设计与实现 页面运用HTML+CSS+Javascript 数据库使用Mysql 结构简单易懂 做毕设的时候用的

2019-01-13

数据结构习题集及答案

数据结构习题集及答案

2019-01-13

大学课程数据结构课后习题答案

数据结构例题 有答案

2019-01-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除