自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 mySQL和Hive的区别

整体1、存储位置:Hive在Hadoop上;Mysql将数据存储在设备或本地系统中;2、数据更新:Hive不支持数据的改写和添加,是在加载的时候就已经确定好了;数据库可以CRUD;3、索引:Hive无索引,每次扫描所有数据,底层是MR,并行计算,适用于大数据量;MySQL有索引,适合在线查询数据;4、执行:Hive底层是MarReduce;MySQL底层是执行引擎;5、可扩展性:Hive:大数据量;MySQL:相对就很少了。语法内容SQLHive非等值连接支持不支持

2022-04-29 23:16:17 13067 1

原创 机器学习相关库的用法

机器学习相关库和函数来自:https://zhuanlan.zhihu.com/p/3429416761、数据预处理相关库和函数作用from sklearn.preprocessing import StandardScaler数据标准化from sklearn.preprocessing import MinMaxScaler数据缩放到[0,1]间from sklearn.preprocessing import Normalizer数据归一化:单位化向量

2021-11-13 20:09:48 1450

原创 presto正则表达式

基础知识便于记忆:\小写字母和\大写字母的含义是相反的。^如果没有在[]里面,则表示以某符号开头,如果在[]里面,则表示是里面内容的反内容。捕获组总结:从按照开括号从左到右,依次是1、2、3…匹配模式贪婪与非贪婪匹配如:String str=“abcaxc”;Patter p=“ab.*c”;贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab.*c)。非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上

2021-07-30 16:13:05 4934

原创 ECharts使用

由于想要学习可视化,通过查找资料发现使用Echarts进行数据可视化是一个比较好的方式。之后百度了一下知道echart是一个插件。Echarts是“开源”的,提供了创建多种多样的图表。包括折线图、坐标系、散点图等等之类的,这里就不一一列举了。大家可以Echart官网去查看接下来简要说以下初始使用步骤:在官网下载Echarts插件源代码(js文件)可能你会犹豫按照那种方式下载哪个会比较好...

2020-02-21 13:24:51 244

转载 决策树cart算法详解

https://blog.csdn.net/e15273/article/details/79648502算法步骤CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测的概率分布,也就是在输入给定的条件下输出的条件概率分布。CAR...

2019-06-25 10:56:15 1317

原创 django中新建一项目直接运行报编码错误

小白 第一次新建Django项目 结果总是显示编码错误报错一大片 很多都和python内置库有关 最后一行是编码问题:utf-8 can’t code byte 0xd7 in position 0 :invalid continuation byte一开始以为是配置错误 重新安装了一遍 ,结果不是最后发现是主机名的问题,主机名不能够是中文,最好改为英文欢迎使用Markdown编辑器...

2019-05-08 08:22:43 269

python中迭代器的使用

python初学者遍历数组时使用迭代器,本代码是一个初步的展示

2018-07-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除