自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(96)
  • 资源 (1)
  • 收藏
  • 关注

原创 sqlpuls

SQLPlus是进行Oracle操作的主要前台工具,用户名和密码分别为用户名和密码,连接ORACLE数据库https://blog.csdn.net/qq_40868987/article/details/85018719

2020-08-24 14:48:11 248

原创 dmp文件

dmp是数据库导出的文件,用以备份数据库用,一般会用exp命令来导出,用imp命令来导入也就是恢复数据库。https://zhidao.baidu.com/question/366790924370215332.html

2020-08-24 11:30:41 2687

原创 Linux指令

1. find基本查找find base_path -name 'xxxx' -print #根据文件名和正则表达式进行搜索,使用选项 -name或find base_path -iname 'xxxx' -print #根据文件名和正则表达式进行搜索,使用选项 -iname(忽略大小写)find的-mtime参数-mtime n 按照文件的更改时间来找文件,n为整数。n 表示文件更改时间距离为n天 -n 表示文件更改时间距离在n天以内 +n 表示文件更改时间距...

2020-08-18 15:13:05 343

原创 数据分析-降维方法归纳

1.缺失值比率(Missing Value Rate)包含太多缺失值的列,包含的信息相对较少,可以将数据列缺失值数目大于某个阈值的列剔除2.低方差滤波(Low Variance Filter)数据列值变化较小的列,包含的信息较少。计算方差前应先对数据做归一化处理3. 高相关滤波(High Correlation Filter)如果两列的数据变化趋势相似,选择其中的一列就可满足要...

2020-08-18 15:00:01 1371

原创 计算机网络知识的学习

1. 负载均衡入门和一些基本概念https://blog.csdn.net/ffm83/article/details/42390045https://blog.csdn.net/qq_44718474/article/details/889369302. tomcat、nginx、apache的区别https://www.zhihu.com/question/32212996/answe...

2020-08-18 14:59:44 114

原创 面经-vivo机器学习算法工程师

1.手撕代码:有序链表删除重复的,保留不重复的。 def deleteDuplicates(self, head): """ :type head: ListNode :rtype: ListNode """ if not head or not head.next: return ...

2020-08-18 14:59:19 629

原创 为面试整理:常见机器学习算法

1.KNN思想:已知带有标签的训练集数据,给定一个测试数据,计算这个测试数据到训练集中各个点的距离并进行排序,选出距离这个测试数据最近的的K个点,然后看这k个点中,那个类别的数据多,那么这个测试数据就属于哪一类。优缺点:思想简单,但是计算量比较大,并且数据集中的各个类型的数据量时平均的,例如A类1000个,B类100个,那么无论如何A类的数据是占优势的。2.决策树2.1 ID3...

2020-08-18 14:58:43 250

原创 数据分析统计知识

1.变异系数1.应用场景: 比较不同样本数据的离散程度时,由于样本基数不同,使用变异系数,变异系数越大,样本的离散程度越大2.定义: 变异系数=样本标准差 / 样本均值2.偏度和峰度1.偏度:偏度是数据分布对称性的度量,正态分布的偏度为0,右长尾分布的是正偏态,左长尾分布的是负偏态2.峰度:正态分布的峰度为0,如果峰度>0,形态比正态分布...

2020-08-18 14:58:27 539

原创 数据分析业务题

1.日活下降怎么分析?一. 首先向技术确认是否是数据异常导致,是否是数据延迟上报等原因导致数据不正确二. 内部原因分析:日活用户由新增用户、老用户、回流用户组成,按用户维度进行拆分,确定是那部分用户导致的日活下降1.如果是新增用户导致的日活下降,可以看下各个拉新渠道的新增用户数,是否是某个拉新渠道出了问题2.如果是老用户导致的日活下降,再对老用户按照年龄、是否是学生、地区、...

2020-08-18 14:58:17 2590

原创 面经-趣头条数据分析实习生

一面:1. 自我介绍2. 第一份实习时间挺长的,负责什么工作?3.研究方向面试官介绍了偏业务的数据分析在做什么工作二面:1.自我介绍2.介绍一下做过的项目,从数据清洗到最后分类(以自己学习的研究课题为例讲的)3.上海地铁数据挖掘项目觉得自己的贡献是啥4.业务分析:以你经常使用的APP为例,分析如果有一天浏览量下降了,是什么原因?解决方法?5.数据中的缺失值、...

2020-08-18 14:58:02 482

原创 日常实习面试问题整理

====================================================================================================亚信科技============================================================================================...

2020-08-18 14:57:50 193

原创 面经-字节跳动数据分析

====================一面============================1. 自我介绍2. 壹账通实习主要工作3. yolov3网络模型是什么样子的?基于darknet-53的网络模型,从名字上看是有53层全连接层,中间还穿插着residual层4. 调参都调的哪些参数?学习设置多少?5. 机器学习分类算法的损失函数?常用回归损失函数:...

2020-08-18 14:57:35 4120

原创 性格问题

1.与别人相比有什么优势,体现在哪里?我不太了解其他人的情况,虽然我作为应届生没有什么工作经验,但是性格方面比较有毅力,比如我在扇贝单词已经坚持打卡600多天,并且会一直坚持下去。工作能力方面,数据分析师的硬技能python、SQL和机器学习算法我也是熟悉的,并且在实习和课题中有一定的应用,因为在互联网行业实习过,掌握数据分析师所必备的软技能业务分析能力,比如常用的分析指标,指标拆解的思维,...

2020-08-18 14:57:11 164

原创 数据分析SQL面经整理

其他:sql语句的执行顺序:from-->join-->on-->where-->groupby-->having-->select-->orderbysql语句的分类:DQL查询语句:select from where DDL定义语句:create alter drop ...

2020-08-18 14:56:40 1749

原创 面经 - 浪潮openday

1. python多线程与多进程区别1. 最大区别是:多进程中,同一个变量,各有一个拷贝存在于每个进程中,互不影响,而多线程中,所有变量由所有线程共享i2.字符串中查找或删除某个字符的查找:pandas中:df['col'].str.contains('substring') ------模糊筛选python中:(1) str.find(str, beg=0, e...

2020-08-18 14:56:18 311

原创 面经 - 中兴(软件测试)

1.什么是事务?事务的特性事务就是一组操作步骤要么同时发生,要么一步也不执行,它保证了数据始终一致的状态,不破坏数据的完整性。比如说同时修改两个表,如果他们是一个事务,当第一个表修改成功而第二个表修改失败时,则两个表都回到修改前的状态,如果他们不是一个事务,只有第二个修改失败的表回到初始状态A原子性:事务是一个不可分割的操作,要么全部执行,要么全部不执行C一致性:事务执行前后数据...

2020-08-18 14:56:07 2282

原创 面经 - 流利说 数据分析师

一面1.自我介绍2.实习中感觉最自豪的一件事,对公司帮助最大背景:米读小说APP在ios应用市场的平均特别低,运营那边需要对一批质量较高的用户做评论引导职责:在表征用户行为的特征中,选择用户近30日阅读时长,用户加入书架书籍数、用户近30天活跃天数、用户的vip状态等九个指标,首先进行数据的预处理,像用户阅读时长、加书架书籍数等数据指标的分布较为长尾,为保证结果的可靠性,将长尾用...

2020-08-18 14:55:52 446

原创 工商上海分行-预面试

1.自我介绍2.银行的技术岗位都是和业务相结合的,你打算怎么把技术与业务相结合?3.介绍一下你的本科学校?我的本科学校是在海滨城市烟台, 是一所综合性的二本院校,前身是烟台师范学院,文化底蕴深厚,已经建校89周年了。而且我们学校的学风也是比较好的,虽然是二本院校,但是考研率还挺高的,同学们都很积极上进。4.山东省优秀毕业生,你觉得因为什么会被评为这个?5.你是党员...

2020-08-18 14:55:30 117

原创 面经 - 小红书 数据分析师

1.自我介绍2.为什么想做数据分析师?对这个行业有什么期望?3.实习做过觉得最成功的一件事?4.用户拐点确定,都找到哪些拐点了?针对拐点有没有想过为什么会出现过这两个拐点?5.sql语句:求所有用户登录的平均时间差lag函数6.小红书发布内容“+“处添加引导功能,怎么评判这个功能加的好不好?你认为哪个指标是最关注的?答了:A/B测试,引导功能的点击pv、uv(跳过...

2020-08-18 14:55:22 1967

原创 顺丰科技面经整理

1.逻辑回归函数的思想,损失函数,损失函数怎么求的,参数更新,正则化知识2.数据倾斜问题是什么?数据倾斜的原因?怎么解决?3.SQL语句:连续登陆三天以上的用户的消费总额4.时间序列分析怎么做?5.时间序列应该考虑哪些关键点?趋势、周期、时期、不稳定因素6.手机销售额下降怎么分析?7.要推广一个新产品,从哪些方面入手?首先必须要确定新产品人群定位,可以分析这部分人群...

2020-08-18 14:45:36 759

原创 改进多分类算法

1.改进的二叉树多分类决策树算法上层节点的分类性能对整个分类模型的影响较大,在分类过程中,应尽量减少上层节点的分类,提出类分离测度,将类分离测度大的属性作为二叉树的上层分叉节点,优先分离参考:《改进的二叉决策树多分类算法在入侵检测中的应用》2.多分类AdaBoost多分类问题的Ada Boost.SAMME算法:α=1/2 * log(1 - e / e) + lg(k - 1)...

2020-08-18 14:43:58 1081

原创 存储过程

一、创建过程1.定义参数:三种类型,输入参数IN,输出参数OUT,输入输出参数INOUT,其中:IN:参数的默认模式,在程序运行时,已经有具体值,在程序体中值不会变;OUT:只能在过程体内部赋值,表示该参数可传回给调用它的存储过程;INOUT:上述两者的结合CREATE PROCEDURE p_name ( IN var0 VARCHAR(100), OUT var1 VARCHAR(100), INOUT var2 VARCHAR(100) )...

2020-07-24 09:04:41 178

原创 数据增强方法(时间序列)

1.DBA(DTW Barycentric Averaging):基于加权形式的DTW中心平均技术,通过改变权重,可以从给定的一组时间序列创建无穷多个新的时间序列。作者在3种加权方法中采用了一种叫做平均选择法的加权方法从训练集中随机选取一个初始时间序列,赋予它0.5的权重,这个随机选择的时间序列将作为DBA的初始化时间序列 根据DTW距离,找到DBA初始化时间序列的最近的5个时间序列 从...

2019-12-17 10:00:35 16394 7

原创 hive中的各种join语句

1.inner join 内连接返回两个表中的交集2.left/right (outer) join以左表/右表为主表,返回的记录与主表记录数相等的记录,没匹配上的为null3.full outer join返回两个表的去重之后的记录4.left semi join返回左表在右表中存在的记录5.cross join返回两个表的笛卡尔积结果,不...

2019-08-30 14:44:52 480

转载 优化算法的介绍

参考:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650720663&idx=3&sn=d9f671f77be23a148d1830448154a545&chksm=871b0de9b06c84ffaf260b9ba2a010108cca62d5ce3dcbd8c98c72c9f786f9cd460b...

2019-07-10 11:06:47 234

转载 移动指数加权平均与修正

转载:博客园:https://www.cnblogs.com/cloud-ken/p/7723755.html指数加权平均举个例子,对于图中英国的温度数据计算移动平均值或者说是移动平均值(Moving average).大体公式就是前一日的V值加上当日温度的0.1倍,如果用红线表示这个计算数值的话就可以得到每日温度的指数加权平均值. ...

2019-07-09 22:39:14 1832

原创 vscode远程连接服务器时一直连接不上的问题

问题:网络是可以的,打开vscode的一瞬间可以连上,然后就显示正在尝试连接....解决过程:1. 先把vscode升级到最新版本,重新连,不行2. 把服务器上的./vscode-server文件卸载,重新连,不行: ①找到位置所在:进入/home/myname文件夹下 --> ll -a(显示隐藏文件指令),找到红框中的文件 ...

2019-07-05 12:07:59 83197 16

原创 从windows本地远程上传文件到Linux服务器

1. Xshell连接上远程服务器2. 检查是否安装rz sz,如下已经安装了,没有安装使用yum install命令安装3. 输入rz指令,选择要上传的文件即可注意:scp指令是从Linux到Linux的,在windows下使用会报错参考:https://blog.csdn.net/m0_37751917/article/details/80739850...

2019-07-05 09:59:08 10741

原创 #98 Validate Binary Search Tree——Top 100 Liked Questions

Given a binary tree, determine if it is a valid binary search tree (BST).Assume a BST is defined as follows:The left subtree of a node contains only nodes with keysless thanthe node's key. The r...

2019-06-02 21:45:23 103

原创 #96 Unique Binary Search Trees——Top 100 Liked Questions

Givenn, how many structurally uniqueBST's(binary search trees) that store values 1 ...n?Example:Input: 3Output: 5Explanation:Given n = 3, there are a total of 5 unique BST's: 1 ...

2019-06-02 20:31:16 89

原创 #94 Binary Tree Inorder Traversal——Top 100 Liked Questions

Given a binary tree, return theinordertraversal of its nodes' values.Example:Input: [1,null,2,3] 1 \ 2 / 3Output: [1,3,2]Follow up:Recursive solution is trivial, could y...

2019-06-02 16:58:49 101

原创 #84 Largest Rectangle in Histogra——Top 100 Liked Questions

Givennnon-negative integers representing the histogram's bar height where the width of each bar is 1, find the area of largest rectangle in the histogram.Above is a histogram where width of ea...

2019-06-01 21:44:43 91

原创 Notepad++中运行Java程序,如果有汉字,就报错的解决方法

问题:原因: 由于JDK是国际版的,在编译的时候,如果我们没有用 -encoding,参数指定我们的JAVA源程序的编码格式,则javac.exe首先获得我们操作系统默认采用的编码格式。解决方法:菜单栏Encoding --> Encode in ANSI参考链接:https://blog.csdn.net/wll780621764/art...

2019-05-30 11:21:42 1930 1

原创 #79 Word Search——Top 100 Liked Questions

Given a 2D board and a word, find if the word exists in the grid.The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or vertically n...

2019-05-28 21:00:27 79

原创 #78 Subsets ——Top 100 Liked Questions

Given a set ofdistinctintegers,nums, return all possible subsets (the power set).Note:The solution set must not contain duplicate subsets.Example:Input: nums = [1,2,3]Output:[ [3], [1...

2019-05-24 21:44:21 72

原创 #76 Minimum Window Substring——Top 100 Liked Questions

Given a string S and a string T, find the minimum window in S which will contain all the characters in T in complexity O(n).Example:Input: S = "ADOBECODEBANC", T = "ABC"Output: "BANC"Note:I...

2019-05-24 21:06:08 71

原创 #75 Sort Colors——Top 100 Liked Questions

Given an array withnobjects colored red, white or blue, sort themin-placeso that objects of the same color are adjacent, with the colors in the order red, white and blue.Here, we will use the in...

2019-05-20 22:31:50 76

原创 #72 Edit Distance——Top 100 Liked Questions

Given two wordsword1andword2, find the minimum number of operations required to convertword1toword2.You have the following 3 operations permitted on a word:Insert a character Delete a chara...

2019-05-20 20:51:01 84

原创 #70 Climbing Stairs——Top 100 Liked Questions

You are climbing a stair case. It takesnsteps to reach to the top.Each time you can either climb 1 or 2 steps. In how many distinct ways can you climb to the top?Note:Givennwill be a positive...

2019-05-20 19:20:05 78

原创 #64 Minimum Path Sum——Top 100 Liked Questions

Given amxngrid filled with non-negative numbers, find a path from top left to bottom right whichminimizesthe sum of all numbers along its path.Note:You can only move either down or right at a...

2019-05-20 17:40:42 86

爬取最好大学排名

看着嵩老师课程写的,代码通俗易懂,能用request库爬去最好大学排名

2018-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除