自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 收藏
  • 关注

原创 欢迎使用CSDN-markdown编辑器

Java基础数据类型: 原生类型:int,double等八种 reference/Object Type(是在哪里存的value、地址) -class object,array变量传引用还是传值 -java是pass by value的(就算是对象),对于dog本身copy了一份,除了用关键字形式定义的原生类型,剩下的都叫reference,copy dog时,把String name的

2017-04-09 20:40:26 354

转载 浅谈语义主题计算

浅谈语义主题计算文章来源:百度搜索研发部两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都

2017-03-13 16:58:54 479

原创 Blas 基本函数功能

CAXPYconstant times a vector plus a vector. //常数乘以一个向量加上一个向量。CCOPY copies a vector x to a vector y.//复制一个向量x到y的向量。CDOTCforms the dot product of two vectors, conjugating the first vector.//结合

2016-12-17 10:11:52 2171

原创 开平方实现

首先是最普通的CRT里自带的sqrt,只需要引用math.h就可以使用了:[cpp] view plain copy print?#include   result = sqrt(number);    接下来是传统的牛顿迭代法,我们计算开方的时候就是手工不断尝试每一位最合适的数字,然后一步步收敛求得更精确的答

2016-12-16 17:09:58 1549

原创 word2vec源码解读

一、Word2Vec程序解析word2vec主要的层次结构vocab是一个结构体数组。*Vocab_hash是一个hash链表。vocab存入词的时候实际是按照先后顺序存储的。为了方便查找,在词存入的时候顺便把词在链表中的位置存入到vocab_hash中,而该词的vocab_hash位置有hash(word)决定,这样查找起来很快

2016-12-16 16:29:10 2445

原创 word2vec实现踩坑

xorshift算法生成随机数的原理是什么?https://www.zhihu.com/question/27951358float与double运行速率问题http://blog.csdn.net/xiaqian0917/article/details/53676644Yoshua Bengio等大神传授:26条深度学习经验http://www.csd

2016-12-15 21:42:20 689

转载 深度学习中的初始化

layer { name: "conv1" type: "Convolution" bottom: "data" top: "conv1" param { lr_mult: 1 } param { lr_mult: 2 } convolution_param { num_output: 32 pad: 2 kernel_s

2016-12-15 21:35:03 3133

转载 汇编学习float与double速率问题

X86处理器包含两种类型的浮点数寄存器。第一种使用8个浮点寄存器组成浮点寄存器栈,另一种为向量寄存器(XMM,YMM),它们对于单双精度的处理是不同的。本文将讨论两种模式下的浮点数计算速度问题。一、当我们编译32位程序时,使用的是x87指令集,即使用浮点寄存器堆栈进行浮点计算。此种情况下,单精度与双精度的处理是统一的,故计算速度上没有差异。我们可以做如下验证:[cs

2016-12-15 21:32:14 2547

原创 算法库:基础线性代数子程序库(Basic Linear Algebra Subprograms,BLAS)介绍

算法库:基础线性代数子程序库(Basic Linear Algebra Subprograms,BLAS)介绍   调试DeepFlow光流算法,由于作者给出的算法是基于Linux系统的,所以要在Windows上运行,不得不做大量的修改工作。移植到Windows平台,除了一些头文件找不到外,还有一些函数也找不到。这其中就涉及到三个函数:sgemv_,sgemm­,saxpy­_。百

2016-12-15 20:45:57 2449

转载 机器学习评价指标大汇总

http://www.zhaokv.com/2016/03/ml-metri点击打开链接c.html?utm_source=tuicool&utm_medium=referral总结、机器学习机器学习评价指标大汇总2016年3月2日 无影随想发表回复在使用机器学习算法的过程中,针对不同场景需要不同的评价指标,在这里对常用的指标进行一个简单的汇总。

2016-12-05 16:35:03 2555

转载 多类分类(Multi-label classification)性能评价之宏平均(macro-average)与微平均(micro-average)

通常,我们在评价classifier的性能时使用的是accuracy考虑在多类分类的背景下accuracy = (分类正确的样本个数) / (分类的所有样本个数)这样做其实看上去也挺不错的,不过可能会出现一个很严重的问题:例如某一个不透明的袋子里面装了1000台手机,其中有600台iphone6, 300台galaxy s6, 50台华为mate7,50台mx4(当然,这些信息分类器是

2016-12-03 15:43:57 17389 11

转载 Kaggle大数据竞赛平台入门

转载自http://www.cnblogs.com/zhao441354231/p/6061363.html大数据竞赛平台,国内主要是天池大数据竞赛和DataCastle,国外主要就是Kaggle.Kaggle是一个数据挖掘的竞赛平台,网站为:https://www.kaggle.com/.很多的机构,企业将问题,描述,期望发布在Kaggle上,以竞赛的方式向广大的数据科学家征集解决方案,

2016-12-01 10:03:36 1045

转载 数据科学的完整学习路径(Python版)

本文由 伯乐在线 - 笑虎 翻译,艾凌风 校稿。未经许可,禁止转载!英文出处:analyticsvidhya。欢迎加入翻译组。从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台)假如你想成为一个数据科学家,或者已经是数据科学家的你想扩展你的技能,那么你已经来对地方了。本文的目的就是给数据分析方面的Python新手提供一个完

2016-11-23 10:44:47 824

转载 九章算法6:Linked List

九章算法6:Linked List内容基于九章算法课件 (http://www.jiuzhang.com/)链表的结构 如果我进行两个操作: 1.node1 = node2; 2.print head具体代码  结果仍是 1 2 3因为node1只是一个地址信息,如果把内存比作一个大数组, 这个node1 

2016-11-21 22:33:47 420

转载 Data Structure

Data Structure内容基于九章算法课件 (http://www.jiuzhang.com/)Linear and treeLinear Data Structure,通常用数组实现 -Queue -Stack -HashTree Data Structure,通常用指针 -TreeQueue : BFSO(1) Push

2016-11-21 22:32:41 256

转载 九章算法7:Array & Numbers

九章算法7:Array & Numbers内容基于九章算法课件 (http://www.jiuzhang.com/)Merge two sorted arrayGiven two sorted integer arrays A and B, merge B into A as one sorted array. A = [1, 2, 3, empty, empty]

2016-11-21 22:31:27 450

转载 九章算法5:动态规划II

九章算法5:动态规划II内容基于九章算法课件 (http://www.jiuzhang.com/)单序列动态规划 题目:Palindrome Partitioning Given a string s, cut s into some substrings such that every substring is a palindrome.Return th

2016-11-21 22:30:22 1467 2

转载 九章算法4:动态规划I

http://blog.csdn.net/github_30242787/article/details/50819414递归和动态规划内容基于九章算法课件 (http://www.jiuzhang.com/)从Triangle这个问题说起:题目:Given a triangle, find the minimum path sum from top

2016-11-21 22:29:15 1167

转载 6 linkedlist

前言又是很长时间才回来发一篇博客,前一个月确实因为杂七杂八的事情影响了很多,现在还是到了大火燃眉毛的时候了,也应该开始继续整理一下算法的思路了。Linked List大家应该是特别熟悉不过的了,因为这个算是数据结构了里面基本上最开始讲的结构吧。这块内容也没有太多需要琢磨的技巧,可以考量的东西也不多,所以考的就是一些小的trick来完成,面试中链表考得特别多,算是面试官对面试者的基础的考查,

2016-11-21 22:17:30 194

转载 4 dynamic programming

前言时隔这么久才发了这篇早在三周前就应该发出来的课堂笔记,由于懒癌犯了,加上各种原因,实在是应该反思。好多课堂上老师说的重要的东西可能细节上有一些急记不住了,但是幸好做了一些笔记,还能够让自己回想起来。动态规划算是我的一道大坎了,本科的时候就基本没有学过,研一的时候老师上课也是吃力的跟上了老师的步伐,其实那个时候老师总结的还是挺好的:把动态规划的题目都分成了一维动规、二维遍历、二维不遍历等

2016-11-21 22:16:03 255

转载 3 Binary Tree & Divide Conquer

前言第一天的算法都还没有缓过来,直接就进入了第二天的算法学习。前一天一直在整理Binary Search的笔记,也没有提前预习一下,好在Binary Tree算是自己最熟的地方了吧(LeetCode上面Binary Tree的题刷了4遍,目前95%以上能够Bug Free)所以还能跟得上,今天听了一下,觉得学习到最多的,就是把Traverse和Divide Conquer分开来讨论,觉得开启了

2016-11-21 22:13:54 256

转载 2 Binary Search

前言先说一些题外的东西吧。受到春跃大神的影响和启发,推荐了这个算法公开课给我,晚上睡觉前点开一看发现课还有两天要开始,本着要好好系统地学习一下算法,于是就爬起来拉上两个小伙伴组团报名了。今天听了第一节课,说真的很实用,特别是对于我这种算法不扎实,并且又想找工作,提高自己的情况。 那就不多说废话了,以后每周都写个总结吧,就趁着这一个月好好把算法提高一下。具体就从:课堂笔记、leetcode和li

2016-11-21 22:12:04 205

转载 机器学习资源博客链接

机器学习与数据挖掘网上资源搜罗——良心推荐2016-03-18 要学习更多点这→ 数据挖掘入门与实战作者: 左飞著有《算法之美——隐匿在数据结构背后的原理(C++版)》原文 http://blog.csdn.net/baimafujinji/article/details/50467970做机器学习和数据挖掘方面的

2016-11-20 12:15:36 311

原创 经典刷题

大公司笔试面试有哪些经典算法题目?牛妹小号最新回答】牛妹帮大家整理了65道面试经典编程题目,求点赞哦https://www.zhihu.com/question/19805213/answer/131897390?from=profile_answer_card

2016-11-19 11:50:03 318

转载 程序员不得不知道的技术面试资料大全

本文由yuanbin和九章算法协同著作。网站推荐GeeksforGeeks.org 非常著名的漏题网站之一。上面会时不时的有各种公司的面试真题漏出。有一些题也会有解法分析。CareerCup.com CC150作者搞的网站,也是著名的漏题网站之一。大家会在上面讨论各个公司的面试题。Glassdoor.com 一个给公司打分的网站,类似yelp的公司版。会有一些人在上面讨论面试题

2016-11-09 15:07:57 286

转载 Java,C++中的容器类

说到容器, 学习C++的都会想到STL库,曾经把STL源码剖析看了两遍,每次头昏脑胀不想再看,现在回想起来,STL库的东西忘的差不多了,就剩几个容器的使用方法了。关于Java的容器,大二的时候就开始学习过,但是却懵懵懂懂,这次把两种语言的容器做个对比,记录下来,希望能够做到帮助自己记忆,同时帮助别人。1、C++容器标准STL序列容器:vector、string、deque和list。

2016-11-01 22:12:40 403

转载 word2vec源码思路和关键变量

最近在看word2vec,虽然看了几位大神些的pdf,但是感觉对于更细的代码思路解释不是特别的到位,尤其对于菜鸟来说,看到这篇博客些的还比较直白和浅显易懂,果断转了转自:http://blog.csdn.net/zshunmiao/article/details/171423891一个输入层 ; 1 个隐含层; 1个输出层syn0       input ->

2016-10-07 19:59:51 267

原创 欢迎使用CSDN-markdown编辑器

http://blog.csdn.net/itplus/article/details/37969635 原始的skip-gram是一种计算语言模型。看题目中说要训练得到词向量,猜测题目里的skip-gram指的是类似于word2vec中的skip-gram 。那么就以word2vec中的经典模型skip-gram negative sampling来举例说明:word2vec中的skip-gra

2016-07-21 11:46:50 252

原创 笔记记录

http://blog.csdn.net/itplus/article/details/37969635

2016-07-19 15:53:56 232

原创 A Neural Probabilistic Language Model

A Neural Probabilistic Language Model,这篇论文是Begio等人在2003年发表的,可以说是词表示的鼻祖。在这里给出简要的译文 A Neural Probabilistic Language Model一个神经概率语言模型摘  要     统计语言模型的一个目标是学习一种语言的单词序列的联合概率函数。因为维数灾难,

2016-07-18 23:25:46 8963 2

原创 storm数据流分组

数据流分组定义了一个数据流中的tuple如何分发给topology中不同bolt的task。Shuffle grouping(随机分组):这种方式会随机分发 tuple 给 bolt 的各个 task,每个bolt 实例接收到的相同数量的 tuple。Fields grouping(按字段分组):根据指定字段的值进行分组。比如说,一个数据流根据“word”字段进行分组,所有具有相同“

2016-07-05 11:24:19 3166

原创 Topology各种方法生命周期

1、在定义Topology实例过程中,定义好Spout实例和Bolt实例2、在提交Topology实例给Nimbus的过程中,会调用TopologyBuilder实例的createTopology()方法,以获取定义的Topology实例。在运行createTopology()方法的过程中,会去调用Spout和Bolt实例上的declareOutputFields()方法和getCompone

2016-07-05 11:16:23 452

原创 git使用笔记

构建远程仓库并与本地的文件夹绑定首先我默认大家已经明白在本地建立版本库,github上创建项目和共钥私钥的问题在这里我们能看到项目的地址在我们自己电脑的版本库里[html] view plain copy git remote add origin [email protected]:xiaoqiannju/hello-world.git

2016-07-05 11:13:21 235

转载 Scala学习笔记(3): 面向对象与容器

面向对象编程这个通过一个例子来解释Scala面向对象编程的基本概念,这里我们需要为MongoDB(一种NoSQL数据库,详见我的另一篇博客)编写一个简单的API。MongoDB官方提供了Java API,而我们要做的是使用Scala对其进行简单的封装。Class先来搭建一个叫MongoClient的类作为建立数据库连接的入口,定义一个MongoClient类,并指定主构造函

2016-05-31 10:44:41 292

转载 CRF学习

刚才写了半天的文章,因为不小心点了舍弃,一切都要重来。怪自己不小心,不过这CSDN的自动保存功能做的有点弱。迅速进入正题。这些天在研究CRF的东西,由于之前对机器学习的方面接触比较少,看CRF比较费力,现在把看到的一些想法分享出来,理解不到位的地方希望大牛过来指点指点。一、CRF的概念和原理参考《条件随机场理论综述》(韩冬雪、周彩根),这篇文章里面对CRF的基本理论都做了介

2016-05-25 23:12:16 726

原创 Storm源码分析--Nimbus-data

nimbus-datastorm-core/backtype/storm/nimbus.clj(defn nimbus-data [conf inimbus] (let [forced-scheduler (.getForcedScheduler inimbus)] {:conf conf :inimbus inimbus

2016-04-05 20:19:13 983

转载 Storm Topology的并发度

Storm Topology的并发度Understanding the parallelism of a Storm topologyhttps://github.com/nathanmarz/storm/wiki/Understanding-the-parallelism-of-a-Storm-topology 概念一个Topology可以包含一个或多个worker(

2016-04-05 13:51:15 276

转载 Storm 简介

Storm 简介https://github.com/nathanmarz/storm/wiki/Documentation 安装和配置Storm的安装比较简单, 下载storm的release版本, 解压, 并且把bin/目录加到环境变量PATH里面去, 就ok了. 参考配置storm开发环境 当然为了运行Storm, 需要装一些其他的依赖的包, 可以参考Twit

2016-04-05 13:49:03 291

转载 worker启动executor源码分析-executor.clj

worker启动executor源码分析-executor.clj在"supervisor启动worker源码分析-worker.clj"一文中,我们详细讲解了worker是如何初始化的。主要通过调用mk-worker函数实现的。在启动worker时,需要启动属于该worker的executor。executor是通过worker执行mk-executor函数进行初始化的。在m

2016-03-26 16:44:55 376

转载 storm启动supervisor源码分析-supervisor.clj

storm启动supervisor源码分析-supervisor.cljsupervisor是storm集群重要组成部分,supervisor主要负责管理各个"工作节点"。supervisor与zookeeper进行通信,通过zookeeper的"watch机制"可以感知到是否有新的任务需要认领或哪些任务被重新分配。我们可以通用执行bin/storm supervisor >/

2016-03-26 16:43:47 1133

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除