- 博客(10)
- 收藏
- 关注
原创 聪明的代码
code1 在《数据算法Hadoop/Spark大数据处理技巧》一书中的第五章的反转排序中有一段映射器的代码能够得到领域为2的所有频度计数,代码量不大,但是思路让人敬佩。 Input:java is a great language output: (java,*) 2 (java,is) 1 (java,a) 1 (is,*) 3 ...
2018-05-15 15:16:28 212
原创 MapReduce的分区与分组的区别
MapReduce的分区与分组的区别 看了许多关于这方面的博客,大多在阐述概念,说的不是很让我明白。 我觉得分区就是根据key来决定哪些key-value被分到同一个reduce处理, 而分组是根据key来决定同一个reduce中的key-value在同一批次中进行处理。 在reduce中,一个key对应着一个迭代器,而这些迭代器中的值就来自于同一组。...
2018-04-24 11:30:49 2596 3
原创 个人所看书籍清单
个人书库本书库用于显示个人已经看过的书籍Android相关 Android编程权威指南 第一行代码 Android Android疯狂讲义 java相关 java核心技术 卷I java核心技术 卷II java编程思想 java多线程核心编程技术 深入理解java虚拟机 数据结构与算法分析java语言描述 Effective Java 中文版 第2版 Python相关1.Python基础教程 第2
2017-12-26 15:50:08 653
原创 Python基础教程学习笔记
第一章 快速改造:基础知识 函数 描述 abs(number) 返回数字的绝对值 cmath.sqtr(number) 返回平方根,也可以应用于负数 float(object) 将字符串和数字装换为浮点数 hel
2017-10-19 11:42:42 257
原创 JAVA 多现程编程核心技术读书笔记
第1章 java多线程技能 页码12: synchronized 可以在任意对象及方法上加锁,而加锁的这段代码称为“互斥区”或“临界区”; 页码19:线程处于正在运行或准备开始运行的状态,就认为线程是“存活”的; 页码20:方法sleep()的作用是在指定的毫秒数内让当前“正在执行的线程”休眠(暂停执行)。这个“正在执行的线程”是指this.currentThread()返回的线程。 页码
2017-06-13 15:34:32 367
原创 使用Apriori算法进行关联分析
1.从大规模数据集中寻找物品间的隐含关系被称作关联分析(association analysis)或者关联规则学习(association rule learning)。 2.如果 某个项集是频繁的,那么它的所有子集也是频繁的;如果一个项集是非频繁集,那么它的所有超集也是非频繁的。
2016-10-09 17:03:32 265
原创 大话设计模式-Chapter7 代理模式
代理模式比较好理解,生活使然; 代理模式是为其他对象提供一种代理以控制对这个对象的访问; 代理模式中,操作的对象不知道真正的操纵者的存在,只知道代理的存在。
2016-06-21 17:04:11 158
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人