自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 收藏
  • 关注

原创 三分钟读完《人人都是产品经理》

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。零、序1、我们应该养成一个习惯,当看到一个观点的时候,就有冲动去寻找与之矛盾的观点,然后通过对不同观点的分析找出背后的原因,从而更全面地理解某个事物。一个人成熟的标志之一就是心中可以容纳各种不同的思想而无碍行事。一、写给-1到3岁的产品经理1、为什么要做产品经理因为,好产品能改变世界...

2021-12-13 21:07:45 464

原创 三分钟读完《长尾理论》

长尾市场的基本特征:第一、它的销售半径远远大于普通的商店;第二,其货架是一个长度大大延伸了的虚拟货架;第三,对产品有需求的特定消费者寻找商品的搜索成本以及交易成本远远低于普通的商店。

2021-12-13 21:02:12 1068

原创 Flink入门教程(四)——窗口(二)

上一节将到标准开窗函数在实时流计算中的实现,这一节我们来讲讲window aggregate。我把这两块都放在窗口来写,因为他们本质都是一种计算的触发机制,即在满足一定情况下去启动需要的计算。不同的是window agg被定义在group by语句中,它定义出一个key,其实就是一个窗口的范围了。window agg还可以形象地看成一个一个按照一定规则排列的桶(bucket),而每一个桶就是一个window,就是一个计算单元。

2021-12-13 20:54:54 3284 3

原创 Flink入门教程(三)——窗口(一)

over window是传统数据库的标准开窗函数,在开窗函数中,每一个元素都触发一个窗口计算,每一个窗口里的元素由当前元素及其相邻元素组成,换句话说,你和你的小伙伴排成一个队伍,那么每个人和满足一定条件的相邻的人可以组成一个小组,同一个人可能属于多个小组,这也是流式数据在开窗计算时的典型现象。简单来说,对流式数据进行开窗计算是为了获取该元素及其周围元素的某个聚合结果,例如累和、最大值、最小值等,而在流式开窗计算中,触发计算的元素一定是当前窗口的最后一条记录。

2021-12-13 20:51:19 3357

原创 项目管理师(高级)论文

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。摘要2019年10月,我作为项目经理参与了国内某著名品牌的大数据中台项目的建设,该项目投资共1500万人民币,建设周期为1年,通过该项目的建设,客户具备了数据采集、实时离线数据存储、数据计算处理,数...

2021-10-09 21:00:51 794

原创 Flink菜鸟教程(二)——时间概念

上一节说到,实时计算中的数据可以看成无界流(unbounded stream),没有确切的结束时间,就像水流一样——逝者如斯夫,不舍昼夜。这也是实时数据区别于离线数据的地方,离线数据是有界的,有确定的开始时间和结束时间,因此所有的离线计算都是基于确定的有限数据展开的。一、实时计算中时间的重要性离线计算模式下,计算引擎摄入全量的需要计算的有界数据,按照确定的维度进行聚合,所有的计算过程都是确定的。但是在实时计算中却截然不同,首先实时计算是持续不断进行的,由于网络波动等情况不可避免,数据最终到达算子的时

2021-06-15 20:41:31 7426 4

原创 Flink菜鸟教程(一)——从入门到开发

从这一期开始,将分享一个新的系列——讲讲Flink菜鸟教程。Flink作为大数据实时计算引擎,受到了越来越多的关注和使用,它的高吞吐、低延迟、以及支持ExactlyOnce语义的优良特性,进一步扩大了自己的粉丝圈。随着社区的发展以及阿里巴巴对Blink(Flink的阿里巴巴版)的开源,Flink SQL的功能也逐步强大,越来越多的开发者已经选择从DataStream API和DataSet API转向了更为简单的SQL API,那么为什么要转向SQL API?主要有这几个原因:第一就是好懂啊!SQL是一

2021-06-15 20:36:37 30519 6

原创 从0到1搭建电商营销数据分析平台(七)——聊聊数据产品

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。​ 这是我写得第一篇关于产品的文章,今天就来讲讲我眼中的电商营销数据分析平台以及我的产品观。电商营销数据分析平台,首先它是一个数据产品,它兼具算力、存储、报表展现、分析于一体;是一款以活动周期数据为主,兼顾日销数据的长周期决策产品;是一个以大数据技术为核心支撑,以业务需求和业务增长为主要导向的内部重要产品。可想而知,在互联网时代的商业决策绝...

2021-03-18 23:04:52 433

原创 从0到1搭建电商营销数据分析平台(六)——聊聊反作弊

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。​ 任何一个平台,无论设计得多么完美,也很难保证自己完美无瑕,毫无破绽。既然有了破绽,就可能被别有用心之人利用、伪造、篡改、甚至牟利。在互联网领域,黑灰产广泛存在,我们熟悉的刷单、刷流量、水军、僵尸粉、抢秒杀、垃圾邮件等等不过是它的冰山一角。其实电商领域也一直是黑灰产的重灾区,可以说已经形成了成熟的“产业链”,甚至在市场上已经有稳定的分工。对...

2021-03-18 23:00:49 1224

原创 从0到1搭建电商营销数据分析平台(五)——流批一体架构

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。​ 传统的LAMDA架构取得了辉煌的成就,大大小小的公司几乎都以LAMDA为模版构建了自己的数据仓库,但是LAMDA架构的缺陷也一直被数据人诟病——由于实时链路和离线链路采用不同的计算引擎,在数据研发的过程中,不得不开发、维护两套代码,不仅开发成本高,而且得时刻保持口径的一致,不然就会造成严重的数据质量问题。在传统的LAMDA架构中,实时与离...

2021-03-18 22:56:54 792

原创 从0到1搭建电商营销数据分析平台(四)——实时&离线&OLAP

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。​ 不管是实时数据,还是离线数据,总是避不开一个问题就是“数据存储”,我们知道实时数据和离线数据在本质上有很多不同,它们对存储介质的要求也是不同的,尤其是在大数据存储的情况下,它们对数据的存储介质提出了更高的要求,同时,结果表的写入和读取还要足够快速才能满足电商数据分析平台的数据展现要求。00 插一段历史 ...

2021-03-18 22:51:08 836 1

原创 从0到1搭建电商营销数据分析平台(三)——数仓新老架构

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。​01 why一个扩展性强,灵活性高的营销数据分析平台必然离不开科学的数据分层架构,数据在数仓中经过层层清洗梳理转换,最后在应用层支撑整个产品的数据服务。那么对于一个实时性要求很强的产品,它的数据分层应该是怎样的呢?实时数仓和离线数仓如何巧妙的结合实现各个域数据的一致性,这是构建电商营销数据分析平台不得不思考的一个问题。# 插一段历史汉武

2021-03-18 22:45:53 818

原创 从0到1搭建电商营销数据分析平台(二)——埋点与采集

欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,祝你成为数据达人。还有面试指导和内推机会。巧妇难为无米之炊,数据就是营销分析平台的米,每一个分析结论的产出都离不开数据。那么数据到底是怎么获取的,如何一步步走到我们的面前,如何熠熠闪光的展现在一个个报表上?在互联网电商领域,数以亿计的移动终端、PC网页,就是用户与系统交互的数据源泉。1、插一段历史最近非常火的电视剧《大秦赋》第四集,秦昭襄王破六国合纵,秦军兵围周王畿,逼迫周天子把象征王权

2020-12-23 22:58:09 1023

原创 从0到1搭建电商营销数据分析平台(一)

从0到1搭建电商营销数据分析平台(一)欢迎关注公众号——《数据三分钟》一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,祝你成为数据达人。还有面试指导和内推机会。电商领域数据是最重要的能源,数据的力量正越来越多的影响和决定着决策。1、电商局势如今中国的电商时代呈现三足鼎立的态势:天猫淘宝深耕多年,品类齐全,头部商家悉数置于囊中;京东自营兼平台,还有高效物流加成,火力全开;拼多多后起之秀,迎头赶上,价格优势与拼团玩法疯狂助长GMV。除此之外,各类垂直电商精工细.

2020-12-23 22:46:32 957

原创 苏苏酱陪你学动态规划(三)——背包问题

1、0-1背包问题 背包问题的典型描述如下: 一、假如你是奥特曼,有N点的攻击力,现在有一些小怪兽,每一个小怪兽被打倒都需要消耗你一定数量的攻击力,同时你将获得该怪兽对应的金币。现在请计算你所能获得的最多金币数。 二、加入你是小偷,带了一个容量为V的包,此时你去商店偷商品(每一个商品都具有不同的价值),每偷一个商品将占用你背包一定的空间,请你偷价值尽...

2019-03-05 22:03:21 456

原创 使用swing换一个国际象棋棋盘的实例

1、完整代码import java.awt.Color;import java.awt.Point;import javax.swing.BorderFactory;import javax.swing.JFrame;import javax.swing.JLabel;public class guo_ji_xiang_qi_qipan { public static voi...

2018-12-24 13:28:03 824 1

原创 JAVA打印杨辉三角(等腰三角形输出)

1、详细代码import java.util.Scanner;public class coding3 { public static void main(String[] args) { System.out.println("输出行数:"); Scanner scan = new Scanner(System.in); int n = scan.nextInt();...

2018-12-11 11:13:14 16419 10

原创 JAVA实现杨辉三角输出

1、完整代码import java.util.Scanner;public class coding3 { public static void main(String[] args) { System.out.println("输出行数:"); Scanner scan = new Scanner(System.in); int n = scan.nextInt();...

2018-12-10 22:45:36 1455

原创 苏苏酱陪你学动态规划(二)——合唱团

1、问题重述     有 n 个学生站成一排,每个学生有一个能力值,牛牛想从这 n 个学生中按照顺序选取 k 名学生,要求相邻两个学生的位置编号的差不超过 d,使得这 k 个学生的能力值的乘积最大,你能返回最大的乘积吗?2、题目分析       题目要求n各学生中选择k个,使这k个学生的能力值乘积最大。这是一个最优化的问题。另外,在优化过程中,提出了相邻两个学生的位置编号差不超过d的约...

2018-11-16 20:27:44 324

原创 苏苏酱陪你学动态规划(一)——股票买卖

1、问题描述     给你一串数字,表示每天的股票价格,你在某一天买进,并在未来的某一天卖出,请求出最大的利润值。     例:     1,2,6,4,3      那么应该在第一天买进,第三天卖出,最多赚52、解题思路     截至某一天,最大的利润值其实之和它前一天的最大利润值有关,那么采用记忆化自低向上的求解方法即可求得最优解。时间复杂度为O(n)。3、JAVA...

2018-11-08 11:39:30 287

原创 苏苏酱陪你学动态规划,拿名企offer

        转眼间我已经是一名研三的老学长,时间飞快,感谢互联网知识社区在我成长中给我的帮助。没有互联网社区的知识共享,很多知识我也难以快速了解;没有互联网社区的知识共享,我也不会发现原来很多看似绞尽脑汁不得解的难题,其实似乎也有章法可循。        赠人玫瑰,手有余香。感谢各位大佬精彩的博客,让每一位初学者如沐春风,似驾千乘之车,徜徉浩瀚技术烟海。然闻道有先后,术业有专攻,我深知秦时...

2018-11-07 20:24:14 260

原创 Python初始化字典的一个非常简便帅气炫酷的方法

1、已知字典值得情况下初始化字典lst = [1,3,5,7,9] #存放字典的键dic = {}.fromkeys(lst,0) #将字典中所有键的值初始化为02、打印初始化效果

2018-10-22 13:44:51 3016

原创 Python千万要注意的全局变量和局部变量问题

1、直接在函数中调用全局变量m = 100def fun(): print("m1:",m)fun()print("m2:", m)输出:2、函数体内调用与全局变量同名的局部变量m = 100def fun(): m = 50 print("m1:",m)fun()print("m2:", m)输出:解释:在函数体内,定义了...

2018-10-20 11:45:20 15043 4

原创 超级好用的Pycharm 2018激活(亲试有效)

请看这篇CSDN博客:https://blog.csdn.net/u014044812/article/details/78727496

2018-10-18 14:10:16 480

原创 一分钟学会读csv文件和写csv文件(python实现)

 import csvwith open('Python-Predict/Data/train.csv') as tra: rdr = csv.reader(tra) items = list(rdr)print("rdr:",rdr)print(items)with open('trainjaja.csv', 'w',newline='') as tra2: ...

2018-10-15 14:56:10 911

原创 详解python中format函数的强大功能

1、参数替换       format函数可以不限定参数个数,不限定参数位置。       一、不设置指定位置,按默认顺序              二、设置指定位置       2、设置参数       3、数字格式输出        ...

2018-09-29 16:56:14 3958

原创 一行python实现字符串或数组反转(一行代码的小诀窍)

1、调用reverse()方法(注意:字符串没有reverse()这个函数调用)      2、使用数组特性       

2018-09-26 21:25:58 3874

原创 使用group by时如何使用where和having

记住两句话就好WHERE语句在GROUP BY语句之前;SQL会在分组之前计算WHERE语句。   HAVING语句在GROUP BY语句之后;SQL会在分组之后计算HAVING语句。

2018-09-13 16:09:34 3593

原创 详解MySQL中LIMIT的使用方法

1、任务描述 搜索表结构中的某些部分的数据,比如,最后面三个,最前面三个,第2到8条记录,等等。2、实战演练 一、select * from tablename order by orderfield desc/asc limit position, counter; position 指示从哪里开始查询,如果是0则是从头开始,counter 表示...

2018-09-11 17:14:53 26350

转载 如何学习Hadoop,学习Hadoop要学什么?怎么学?

转载自:http://lxw1234.com/archives/2016/11/779.htm第一章:初识Hadoop第二章:更高效的WordCount第三章:把别处的数据搞到Hadoop上第四章:把Hadoop上的数据搞到别处去第五章:快一点吧,我的SQL第六章:一夫多妻制第七章:越来越多的分析任务第八章:我的数据要实时第九章:我的数据要对外第十章:牛逼高大上的机器学习...

2018-09-11 15:48:51 4954

转载 一文解决中文在Eclipse中显示乱码的问题

很多童鞋反应在吧项目导入到eclipse(myeclipse)时中文会有乱码,修改了编码格式后还是乱码,这里给大家介绍一下关于中文乱码时修改编码的注意事项: 当在eclipse中打开一个文件后发现有中文乱码后,千万不能修改这个文件内容,一旦改过这个文件的内容,那怎么修改编码也没用了,只能重新导入。 当打开文件发现乱码后第一步是关闭这个文件,然后在这个文件上右键,选择属性,然后选择编...

2018-09-08 13:46:40 9860 2

原创 python实现二叉树深度遍历

1、什么是深度优先遍历      其实深度优先遍历你可以把它看成是前序遍历,比如对于如下二叉树:             其深度遍历的结果是:1,2,4,8,9,5,3,6,72、解题思路      一、采用递归的方式进行遍历。      二、利用栈,先将根入栈,再将根出栈,并将根的右子树,左子树存入栈,按照栈的先进后出规则来实现深度优先遍历。3、编程实现clas...

2018-09-04 16:30:05 5629 2

原创 python实现二叉树层次遍历(宽度优先遍历或叫广度优先遍历)

1、何为层次遍历      说白了,就是一层一层、由上至下、由左至右的搜索遍历二叉树中的元素。              上面这个二叉树,那么层次遍历的输出应该是:1、2、3、4、5、6、7、8、92、解题思路       利用队列,依次将根,左子树,右子树存入队列,按照队列的先进先出规则来实现层次遍历。3、编程实现class Node(): # 节点类 ...

2018-09-04 15:47:58 9303 3

原创 详解两个队列实现一个栈(python实现——经典面试题)

1、任务详解       使用两个队列数据结构实现一个栈,要求实现栈的出栈和进栈操作。2、解题思路       push()操作:       为了保证先进栈的元素一直在栈底,需要将两个队列交替使用,才能满足需求。因此,想法是,我们只在空的那个队列上添加元素,然后把非空的那个队列中的元素全部追加到当前这个队列。这样一来,我们又得到一个空的队列,供下一次添加元素。       p...

2018-09-03 16:18:29 5463 1

原创 详解两个栈实现一个队列(python实现——经典面试题)

1、题目说明      使用两个栈结构,实现一个队列功能,实现队列的添加元素和弹出元素。      注意:      队列特点是只能在队列尾部添加元素,在队列头部删除元素,先进先出(FIFO/LILO)2、结题思路       两个栈可以巧妙的结合,第一个栈用来添加元素,而在第二个栈中弹出元素。       我们把所有添加元素的操作放在第一个栈中实现,当需要弹出元素时全部放...

2018-09-03 11:45:03 2050 1

转载 一文彻底搞懂python中的self

在介绍Python的self用法之前,先来介绍下Python中的类和实例…… 我们知道,面向对象最重要的概念就是类(class)和实例(instance),类是抽象的模板,比如学生这个抽象的事物,可以用一个Student类来表示。而实例是根据类创建出来的一个个具体的“对象”,每一个对象都从类中继承有相同的方法,但各自的数据可能不同。 1、以Student类为例,在Python中,定义类如下:...

2018-09-03 10:53:11 8446 3

原创 python制作exe可执行表白神器

1、效果图2、程序源码import turtleimport time#writing txtturtle.hideturtle()turtle.penup()turtle.goto(130,50)# turtle.pendown()turtle.color("blue")turtle.write("亲爱的,给你画个东西",font = ("Times",18,"bo...

2018-08-29 15:07:41 4964 1

原创 将python程序转成exe可执行文件

1、需要安装pyinstaller(命令:pip install pyinstaller)2、进入到python文件所在文件夹3、生成exe文件(命令:pyinstaller *.py)

2018-08-29 14:57:51 705

原创 递归求解走台阶问题,一次可以走一步、两步、三步、...、n步(经典面试题——增强版走台阶)

1、问题描述      现在有一个台阶,一共有n阶,你一次性可以走1步、2步、3步、......、n步。问:一共有多少种走法。2、求解思路      第一步走1阶:那么这种情况下的走法数量和剩下n-1阶的走法数量有关;      第一步走2阶:那么这种情况下的走法数量和剩下n-2阶的走法数量有关;      第一步走3阶:那么这种情况下的走法数量和剩下n-3阶的走法数量有关;...

2018-08-28 15:51:06 11566 1

原创 MATLAB中load函数读取文件出错解决(ASCII 文件 *.txt 的行号 1 中的文本未知)

1、准备数据 这里用Excel数据为例,MATLAB可以读取很多不同格式的文件的数据。 下面是展示的Excel文件内容:2、转成txt文件 点击,文件——另存为——其他格式,选择下图所示文件格式即可。3、使用MATLAB读取文件>> load haha.txt错误使用 loadASCII 文件 haha.txt 的行号...

2018-08-27 14:53:14 50086

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除