自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 继承和组合

1,继承代表is a;组合代表has a;狗一个动物,用继承表示,而我有一双明亮的眼睛用组合表示;

2016-08-19 11:04:52 266

原创 初始化

1,定义处初始化:在构造函数运行之前对它赋值,即在实例存在之前已经初始化;2,构造函数初始化:在构造函数中,对变量赋值;3,实例化初始化:在{}括号中对它赋值;4,delayed 赋值:在用到的时候再赋值;

2016-08-18 17:37:11 284

原创 java方法的重载

1,对于没有构造器的类,编译器会默认的给你创建一个无参的构造器;2,对于有定义构造器的类,编译器不会创建无参构造器;3,方法的重载是根据参数的类型和个数的,不根据返回值的类型,因为有的时候我们不关心返回值的类型,此时如果直接调用方法,编译器 不知道到底是调用的那个函数,就无法转换成对应的字节码,就无法编译成功;反正编译器的所有的逻辑都是为了方便程序员的编写代码,都是帮助程序员来写代码。

2016-08-16 12:20:56 252

原创 java异常

java异常:throwable:子类error和exception;exception子类runtimeexception和checkedexception(除了runtimeexception之外的)等;error是JVM发出的异常,是不可处理的异常;runtimeexception是运行时候才会发生的异常,这种异常太多,如果都捕获的话代码太臃肿;其他异常是编译的时候可以预先处

2016-08-15 14:55:31 210

原创 sizeofc

1,c中有sizeof是因为需要在不同的机器之间移植,而java不需要是因为它在任何机器上占的位数是一样的。2,>移位操作是有符号移位,而>>>是无符号移位符;3,short,byte,char移位时候需要先把它转换为int来移位;4,boolean类型的数据不能加减乘除运算,只能判断是否为true;

2016-08-14 13:29:43 231

原创 thinking in java 第一章对象导论总结

1,在解决的问题和用的方法之间对象是一一映射的;2,对象要有接口;3,对象可以复用:主要是可以extends,可以组合,聚合使用;4,为了安全,对象还要有访问权限:private,protected,default,public;5,泛型:编译的时候,只检查参数和返回值,并不知道具体的执行的确切代码,用一段特殊代码代替具体的地址调用;6,聚合和组合的区别:聚合has a;组合c

2016-08-12 21:08:22 287

原创 大数相减

public static String sub(String str1,String str2){ int m=str1.length(); int n=str2.length(); if(m!=n){ byte[] buff=new byte[m>n?m-n:n-m]; for(int k=0;k<buff.length;k++){ buff[k]='0';

2016-08-12 14:37:01 213

原创 大数相加算法

public static String add(String str1,String str2){ int m=str1.length(); int n=str2.length(); if(m!=n){ byte[] buff=new byte[m>n?m-n:n-m]; for(int k=0;k<buff.length;k++){ buff[k]='0';

2016-08-12 11:33:18 399

原创 大数相乘

双层循环算法:时间复杂度O(N^2) ;空间复杂度:O(m+n);下面是源码:package algorithm;public class BigNumMul {public static void main(String args[]){String a="999";String b="99999999";String r=mul(a,b);System.

2016-08-11 22:47:33 302

原创 随机算法求数组中第k大的

import java.util.Random;public class Find{public int findK(int []array,int length,int k){Random random=new Random();int rand_index=random.nextInt(length); int temp1=array[0];array[0]

2016-07-22 13:23:44 445

原创 日报16.6.15

1,linux第二章的剩余部分:除了内存,cpu还有第二层高速缓存;bios和cmos是什么东西?韧体:不能更新的写死的程序,对硬件进行操作。什么操作系统?通过内核对硬件进行操作,对外提供接口,让开发者可以运用接口写应用程序。编译器是把高级语言代码转换成计算机可以读懂的机器代码,从而执行操作。操作系统:通过管理计算机并且驱动所有的硬件。硬盘:扇区,磁道。固态硬盘是什么:不用与普通的硬盘,是通过内存

2016-06-15 17:36:57 238

原创 日报2016.6.14

1,2A-2L: 如何增加noise,如何去掉noise(用高斯kernel),sigma越大则,noise越多,对于kernel来说,sigma越大,则越smooth。因为sigma越大则是smooth。2,鸟哥私房菜:cpu的分类,cpu的其他组件的交互方式,cpu的组成,外频,内频,超频。14页。

2016-06-14 18:38:42 279

原创 日记2016,6,13

1,完成mergesort,并且对其debug,它递归的层数是log2(n),每次的任务是把两个相邻的模块排序完成,这两个相邻的模块开始是两个相邻的数字,然后是两个相邻的长度相同的模块;2,完成2A-1l中的视屏:主要是讲解了图片的存在方式和对于图片的一些运算和 操作,可以图片进行计算和展示,并且计算它的size和class。

2016-06-13 20:05:44 221

原创 日志6.12

今日工作:1,看了computer vision 的1A-1l:讲了computer vision 和computer photograph的区别:前者是图像识别和vedio识别,后者是通过一些图片等等艺术形式来捕捉到情景当中的光。2,安装了java开发环境。未完成工作:mergesort明日工作:1,mergesort ,2,2A-1l的视频。

2016-06-12 18:57:23 308

转载 variance 和 bias区别

2016-03-19 08:57:12 488

原创 anomaly detection ng recommender system

anomaly detection 异常检测比如检测飞机零件的异常,为什么不能用线性regression呢?当positive exaple非常少的时候。用高斯分布来检测异常。如何检测算法的正确性?用正常的来得到高斯分布,然后用正常的和异常的分别用做,cv和test集合。当feature不是正态分布的时候要把它转换成正态分布。++++++++++++++++++++++

2015-11-19 19:28:06 374

原创 case based machine learning

开始学习一门新课了,mark一下

2015-11-19 09:09:40 407

原创 k-means clustering and pca

k-means clustering : unsupervised learning.k-means clustering: 首先k个点当做中心,然后将其他的点分为三类。然后重新找k个点(找mean值点),当做中心。一直到cost function的值不变或者变化很小为止。有的时候并不是最优解,这个时候该如何?用循环来解决,每一次计算cost,去最小值。就是最优解。k如何选择?elbo

2015-11-13 19:41:19 783

原创 ng 第七章 svm supported vector machine

这章第一讲首先提出了当n(特征值)特别多的时候,logistics learning的低效。然后提出了一个解决方法,用f函数来代替特征x,f是判断x和l的相似度的函数,l是landmark,表示x中的几个点(引出了一个问题,如何选择landmark,当有m个data的时候,我们选择每一个data都是一个landmark),cost方法也做了更改。做了更改之后计算更高效了。因为原来是一个指数函数

2015-11-08 15:42:43 467

原创 ng 第六讲

如何来评价一个h是否是好的,就要验证,如何验证?把data分为training set ,cv set和test set三个集合。bias和variance 的区别。它们的error(cv)都比较大,它们的error(train),前者大,后者小。当d(特征的次方)增大的时候,error(train)在减小,但是error(cv)减小到一个点,就会增大。就是要找到一个折中点d。还有分别对于两种

2015-11-07 21:43:10 357

原创 ng机器 神经网络 应用

如何优化,是增加lambda的值,还是减少?是增加特征变量的值,还是减少?等等。通过training set得到theta的值,在通过cross validation来验证theta的值然后通过test set来测试它的值。在bias和variance之间找到一个折中点。cost函数和lambda的关系是什么?如何选择lambda?找到一个适中点。对不同的lambda做实验找到最好的l

2015-10-31 21:41:11 299

原创 ng机器学习——神经网络

首先提出问题,如果不是线性的问题问题怎么办?如果是多个分类怎么办?此时就想到了神经网络。神经网络的创意来自于人的脑神经中人的神经元之间的信息的传递是层层递进的。下面是一个例子,就是为什么用到神经网络的例子,在复杂的分类的时候会用到。神经网络的cost function怎么表示?gradient computation:backpropagation algorithm(向后传播算法)

2015-10-27 20:42:57 285

原创 jvm垃圾收集器与内存分配策略

Serial收集器,历史最悠久的收集器,缺点单线程,不支持并发和并行;优点是简单高效。(对新生代回收,复制)ParNew收集器,是serial的多线程版本,支持并发(多个垃圾回收线程,但是用户线程要停顿),但不支持并行(垃圾线程和用户线程同时运行)。(对新生代回收,复制)Parallel Scavenge收集器,复制算法,更注重于吞吐量,GC停顿时间的缩短是以吞吐量和新生代空间为代价的。

2015-10-15 14:00:42 358

原创 jvm -垃圾回收概述

那些内存需要回收,什么时候回收,怎么回收?1,没有引用指向它时候,这段内存就可以回收了,这是一般看法,所以可以设置一个程序对象的引用计数器,当等于0的时候就回收。但是这个是有问题的。可达性分析:判断对象是否存活,算法的思想搜通过一系列可以作为gc-root的对象作为起始点,从起始点开始向下搜索,经过的路径叫引用链,如果一个对象到gc-root没有引用链的时候就可以回收了。可以作为gc-root

2015-10-13 16:31:42 441

原创 adapter模式 ——java设计模式

adapter模式:把已经存在的接口转化成客户想要的接口。为什么要转化呢?因为两个接口的方法名字存在差异。比如我有一个shape类,可以让客户实现画任何的图形,有draw方法,但是现在有一个xx_circle类,它只有drawit方法,那这时候就要将继承于shape类的circle类中定义一个私有的xx_circle 变量,将xx_circle封装起来,实现draw方法。这是对象实现方式,另一种方

2015-10-13 16:20:24 250

原创 jvm虚拟机第二章

jvm内存区域和内存异常:内存区域:方法区(类的信息,静态变量,常量的存放位置),java堆(垃圾堆,因为这是垃圾回收器主要作用的区域),虚拟机栈(存放局部变量栈,还负责对某些方法.class文件的调用),本地方法栈(对native方法的调用),程序计数器(当前程序执行的字节码的行号指示器)。                                                

2015-10-12 15:31:10 232

原创 facadez模式

当一个系统非常复杂,当我们只用到了其中一部分功能的时候,这个时候就要用到一个facade。比如我们要吃饭,如果世界上没有饭店,没有农民,那我们就要自己种菜,自己摘菜,自己洗菜,自己做菜,做菜的前提是你要回做饭,否则做出来的还不好吃。但是当有了饭店以后,我们只需要去饭店叫单,付款,就可以吃饭了,此时饭店就成了我和吃饭(如果把它当做一个复杂的系统的话)之间的接口。我只需要知道如何去饭店就好了。而fac

2015-10-10 13:53:45 278

原创 ng机器学习第三讲logistic regression

logistic regression:通过一个例子:给定一个细胞的大小等feature,让你判断它是否是malign,输出的y只有两种情况即,是或者否。此时就不用linear regression了。而用logistic regression,虽然它是regression,但是其实是classification分类问题。

2015-10-06 12:24:20 595

原创 台大机器学习第三讲和第四讲

第三讲 学习的方式一    y的维度h的输出可能不是一个yes和no能解决的,可能是全体实数,可能是枚举值等二   学习的方法 supervised learning  知道所有的yunsupervised learning  不知道ysemi-supervised learning 知道一部分y inforce learning  告诉机器那个是不对的,就像训练狗一样

2015-10-03 11:05:28 349

原创 ng 机器学习第二讲

ng机器学习第二讲:多变量的线性回归,步长要合适,如果太大了则可能会错过最小值点,如果太小了它计算的速度又太慢。有的变量的数值太大,此时要把它的值先规范化,然后再开始求解。

2015-10-02 21:08:27 314

原创 java设计模式前奏+jvm简介+数据结构字符串的复习

过程分解:面向过程的编程是将一个功能分解成一个一个的小问题,一个一个解决。这样主函数可能忙不过来,容易出错,此时就要将责任转移到各个对象,这样就可以更少的出错。对象就是责任。消息的传递,而不是功能的调用。内聚和耦合:内聚是整个对象内部的功能的相关性,而耦合是对象之间的关系。松耦合是最好的。抽象更像是一个占位,定义了一个相关的类要遵循的标准,而不是不能实现的类。接口:将类保护起来,免受其

2015-10-01 21:47:08 356

原创 上午所学(jvm内存分配和shell排序算法的深入理解)

jvm的内存分配:数组是24+;对象引用8,封装类24,对象头部16shell排序算法:两个元素可能会比较多次;一个数组3-sort以后,一定是6sort 和9sort的。

2015-09-24 11:51:44 427

原创 process mining(data source+d)+算法第二讲

data source:数据的来源,没什么可说的。alpha算法:就是找到一条一条的边,最大的边。算法:bag stack queue,s[0]=null(告诉垃圾回收器可以回收了)内存分配:数组的reference是8个字节,对象的是24个字节,数组每次分配不够的时候回将它的内存double,为什么double因为这样效率高。当内存减小的时候是shrink它的空间,什么时候?当它的内

2015-09-23 22:24:58 859

原创 unsupervised learning(association)

会有一个空间爆炸的问题,所以弃了。sequence挖掘,无法捕捉到同步,所以也弃了。验证方法:recall和confidence;overfitting和underfitting。training set和testing set。等方法。

2015-09-21 12:22:25 368

原创 台大学习第二讲PLA(感知学习算法)

感知学习方法:线性分类:即给机器一些资料,机器通过这些资料得出结论。比如,一个人要申请信用卡,机器要通过资料得出是否要给他发信用卡,即给机器x,机器得出y的结论。机器要做的就是得出一个函数,能够解决这个问题。前提是资料是线性可分的。具体如何实现,设函数是一个线性的,然后给不同的变量设置不同的权重,开始的时候权重是0,带入x的值,如果w和x的乘积是负的,而实际上对应的y是正的,就代表w和x之间的

2015-09-21 11:04:47 350

原创 台大机器学习第一讲

什么是机器学习:学习是什么,通过你的观察,不断的联系,得出一个结论。what?机器通过观察学习得到新的知识。how?通过给机器data,电脑不能观察,所以直接给他data。why?因为人脑的计算能力是有限的,就像人活得久了可以有许多的经验,就知道遇到新的情况以后该怎么作出决定。机器学习的应用:预测决断。机器学习的组件:从资料出发,得出一个h,希望h和f(未知的函数,可以准确的通

2015-09-15 19:49:38 423

原创 算法第一章+process mining(k—means clustering )

unsupervised learning:k-means clustering和 agglomerate凝聚k-means clustering:首先定k个点当做中心,按照距离将其他的点分成k类。有关问题:k如何选择(一般是选一个小点的值,然后增加,最后找到最好的k值)。凝聚的聚类方法:距离最近的凑在一起,可以根据这个画出一个dendrogram(系统图)。算法第一章(第二部分):

2015-09-14 12:34:40 653

原创 decision tree+percolation(笔记)+javaio

数据挖掘分类:supervised和unsupervised两类。supervised有:classification和regression,decision tree 。unsupervised有clustering,association两类。今天看了decision tree这一节。decision tree就是有各种属性和路劲。属性是分类的根本。有predictor factor 和r

2015-09-11 20:49:38 427

原创 第一篇文章

看到师兄们为工作发愁,我在想我现在也要努力了,如果现在不开始准备的话,明年就是我发愁的时候了,为了不让自己那么可怜或许我也该开始努力了。以后每天要写一篇,记录一下我每天的所学。先给自己打打气,我不可能每天写,但是至少每周要写五篇。fighting!!!学些什么好呢?算法,机器学习,就先这两个好了。

2015-09-10 13:39:39 199

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除