- 博客(4)
- 收藏
- 关注
原创 Hadoop可能考点汇总
应用案例:动态统计每天开播时间最长主播Top10hadoop3.0框架大数据的生态圈核心框架:Hadoop 铁三角模块——分布式存储、分布式计算、集群管理。负责的数据存储模块为spark flink提供底层基础内容。 hadoop为地基 为上层的其余计算框架作为绿叶提供支柱。Hive和Hbase均为hadoop的子孙后代,Yarn负责为用mapreduce、s...
2020-03-12 14:33:19 271
原创 Python机器学习——Sklearn学习笔记
Sklearn 学习笔记思维导图图片.png图片.png图片.png图片.png图片.png特征工程为将预处理过的数据转化为可以被算法所用的数据 date string 类型转为可处理的数据类型数据集&sklearn基本介绍图片.png图片.pngsklearn 数据集导入*用导入数据集名称代替图片.png...
2020-03-11 13:43:55 1714
原创 动态规划 6 (dynamic programming; DP问题)
背包问题和fatmouse贪心算法区别在于背包所能装入的物品最小单位是一件(即离散),故不可采用价值除以质量的方式求最优解如背包限定重量为50 而后者装入斤数可为连续任意数值。另附上数字三角形代码动态规划核心思想在于由一个最小的局部最优解(最优子结构)递推(for 循环)至全局最优解,涵盖所有可能性但避免了重复计算(高效)。#include <math.h>...
2018-07-24 12:16:12 133
转载 并查集简单解释
来看一个实例,杭电1232畅通工程首先在地图上给你若干个城镇,这些城镇都可以看作点,然后告诉你哪些对城镇之间是有道路直接相连的。最后要解决的是整幅图的连通性问题。比如随意给你两个点,让你判断它们是否连通,或者问你整幅图一共有几个连通分支,也就是被分成了几个互相独立的块。像畅通工程这题,问还需要修几条路,实质就是求有几个连通分支。如果是1个连通分支,说明整幅图上的点都连起来了,不用再修路了;如果...
2018-07-24 12:15:44 141
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人