自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 资源 (1)
  • 收藏
  • 关注

原创 Alternating Least Squares(ASL) for Implicit Feedback Datasets的数学推导以及用Python实现

最近在看CF的相关论文,《Collaborative Filtering for Implicit Feedback Datasets》思想很好,很容易理解,但是从目标函数 是如何推导出Xu和Yi的更新公式的推导过程却没有很好的描述,所以下面写一下 推导: 首先对Xu求导: 其中Y是item矩阵,n*f维,每一行是一个item_vec,C^u是n*n维的对角矩阵, 对角线上

2015-07-27 18:52:47 2630 2

原创 共轭梯度法(conjugate gradient method)

该方法是快速求解Ax=b线性系统的方法,他要求矩阵A是对称正定矩阵。 算法执行过程: matlab实现:clear;%删除工作空间的所有变量,释放系统内存clc;%清楚命名窗口A=[4 1;1 3];b=[1,2]';N=length(b); %解向量的维数fprintf('库函数计算结果:');x=inv(A)*b %库函数计算结果x=[2;1];

2015-07-25 16:43:12 2882

原创 word2vec.c源码分析

#include <stdio.h>#include <stdlib.h>#include <string.h>#include <math.h>#include <pthread.h>#define MAX_STRING 100#define EXP_TABLE_SIZE 1000#define MAX_EXP 6#define MAX_SENTENCE_LENGTH 1000#d

2015-07-08 16:49:30 1467

原创 Mahout-HashMap的进化版FastByIdMap

FastByIdMap是基于散列的,在处理冲突时是线性探测而非分离链接,这样就不必为每一个条目增加一个Map.Entry对象,从而节省内存开销。 下面代码是一个线性探测Map的Demo:package com.example.mahout;public class ArrayHashST_Linear_Probing<Key, Val> { private int M = 30001;

2015-07-07 20:20:53 1798

原创 Mahout-Pearson correlation的实现

计算公式: 并通过下面代码对Mahout in Action的结果进行了验证: 代码如下: ` package com.example.mahout;public class TestColl {public static void main(String[] args) { // TODO Auto-generated method stub //int a[]={

2015-07-07 19:59:21 1096

原创 Linux(CentOS)SSH无密码验证登陆

最近在搭建Hadoop集群,为了操作方便,需要Master用无密码验证的方式的SSH登陆Slave,下面是技术总结。 1.首先在Slave上创建用户hadoop,并设置密码-bash-4.1# useradd hadoop-bash-4.1# ls -l /home总用量 8drwx------ 2 hadoop hadoop 4096 6月 10 12:58 hadoopdrwx---

2015-06-10 21:27:35 873

原创 linux(CentOS) 下安装java运行环境及输出Hello World

最近打算学习hadoop和spark,需要安装java运行环境,我用的系统是CentOS。 一、安装jdk 1.进入usr目录cd /usr2.在usr目录下建立java安装目录mkdir java3.将jdk-8u45-linux-x64.rpm拷贝到java目录下cp /root/hadoop_home /usr/java/4.安装jdkcd /usr/javarpm -ivh jdk-8u

2015-06-09 19:05:10 1066

原创 Linux 常用命令

1.对.tgz格式的文件解压缩:tar zxvf MY_NAME.tgz

2015-06-01 13:48:39 731

转载 Linux下的Libsvm使用历程录

技术链接: http://www.ithao123.cn/content-839597.html

2015-05-27 18:15:52 479

转载 linux 技巧:使用 screen 管理你的远程会话

技术链接:http://www.ibm.com/developerworks/cn/linux/l-cn-screen/

2015-05-27 16:36:07 331

原创 POJ-The Perfect Stall-最大图匹配

题目链接:http://poj.org/problem?id=1274 最大图匹配算法分析:http://blog.csdn.net/dark_scope/article/details/8880547#include <stdio.h>#include <stdlib.h>#include <string.h>bool line[205][205];int link[205];bool

2015-05-23 21:37:20 499

原创 Erlang -奇偶并行排序

-module (exe9). -export ([start/2,handle/4]). % L=[2,12,14,25,31,42,43,43,13,34,34,41,41,312,352,354].% 将数据分给各个进程,并创建 nodecreater([],Pids,M,Id,Master) -> io:form

2015-05-22 09:36:52 853

原创 POJ-Drainage Ditches-最大流入门题

EK算法简介:http://www.wutianqi.com/?p=3107#include <iostream>#include <queue>#include <algorithm>using namespace std;const int msize = 205;int N, M; // N--路径数, M--结点数int r[msize][msize]; //

2015-05-18 23:56:18 603

原创 CodeForces-Learning Languages

#include <stdio.h>#include <string.h>#include <stdlib.h>/*这道题目考查并查集,特别注意每个人都不会语言的情况,此时结果为n。*/int father[105];int lang[105][105];int flag[105];int set[105];int find(int x){ int r = x;

2015-05-16 23:27:54 657

转载 Linux的sort用法

sort命令是帮我们依据不同的数据类型进行排序,其语法及常用参数格式:   sort [-bcfMnrtk][源文件][-o 输出文件] 补充说明:sort可针对文本文件的内容,以行为单位来排序。参  数: -b 忽略每行前面开始出的空格字符。 -c 检查文件是否已经按照顺序排序。 -f 排序时,忽略大小写字母。 -M 将前面3个字母依照月份的缩写进行排

2015-05-15 16:54:15 505

原创 Vim使用技巧

一、移动光标 1、左移h、右移l、下移j、上移k 2、向下翻页ctrl + f,向上翻页ctrl + b 3、向下翻半页ctrl + d,向上翻半页ctrl + u 4、移动到行尾$,移动到行首0(数字),移动到行首第一个字符处^ 5、移动光标到下一个句子 ),移动光标到上一个句子( 6、移动到段首{,移动到段尾} 7、移动到下一个词w,移动到上一个词b 8、移动到文档开始gg,移动

2015-05-14 18:57:14 851

原创 多线程版本的Item_KNN的C语言实现

这里模仿了Word2vec里面构建Hash索引的思想。#include <stdio.h>#include <stdlib.h>#include <string.h>#include <math.h>#include <stdlib.h>#include <time.h>#include <pthread.h>#define MaxString 50#define MaxUserSi

2015-05-11 15:04:10 1447

原创 Erlang 并行快速排序

这个代码主要是参考同学的这篇博客:http://blog.csdn.net/mutx_lck/article/details/45603767 。-module (exe7). -export ([start/2,handle/5,partition/1,list_length/1]). start (Data,M) -> Pid= spawn(?MODULE,handle,[Da

2015-05-11 14:59:41 615

原创 多线程版本的User_KNN的C语言实现

其中的数据格式: 一行一个用户购买记录,uid pid1 pid2…#include <stdio.h>#include <stdlib.h>#include <string.h>#include <math.h>#include <stdlib.h>#include <time.h>#include <pthread.h>#define MaxString 50#define M

2015-05-07 15:37:39 1056

原创 Erlang-蒙特卡洛方法求Pi

-module(exe5_2).-export([start/2]).%Points 是投掷点的个数 Cores是核数,为2的幂start(Points,Cores) ->spawn(fun()->parent_proces(Points,Cores) end), io:format("").parent_proces(Points,Cores) -> Poin

2015-04-20 15:02:46 771

原创 Erlang-多核并发时的树形通信

这段代码不是我写的,谢谢实验室的的师妹,接下来要把树形通信应用到求Pi上去。-module(my).-export([main/1,temp/2,integer_to_atom/1,judge/3,ceil/1]).main(CoreNum) -> SumDie=temp(CoreNum,1), Time=erlang:now(),

2015-04-18 20:38:23 925

原创 Erlang-并行梯度积分法

这个代码写了两天,从没思路到有思路,还好最终搞定了~不过这个进程数必须为2^n个。 先贴一个运行截图: -module(exe4).-export([start/5]).start(F,X1,X2,Num,Cores) ->spawn(fun()->parent_proces(F,X1,X2,Num,Cores) end), io:format("").parent_proce

2015-04-13 23:38:37 966

原创 word2vec中 distence.c 文件源码分析

#include <stdio.h>#include <string.h>#include <math.h>//#include <malloc.h>#include <stdlib.h>const long long max_size = 2000; // max length of stringsconst long long N = 5;

2015-04-09 20:01:27 1424

原创 Alias Sampling Algorithm With GSL C代码实现

最近读论文《Large-scale Information Network Embedding》 看到里面对超大数量的边进行采样时采用了Alias Sampling Algotithm,他的优点是可以O(1)的时间采样。下面涉及了gsl,安装方法很简单。 下面是gsl的资料: http://www.gnu.org/software/gsl/manual/html_node/#include <

2015-04-07 19:56:24 1144

原创 Erlang-实现进程环

M是消息传递数目,N进程数量,Msg是传递的消息-module(exe3_2).-export([start/3,stop/0]).start(M,N,Msg) ->register(ring,spawn(fun()->ring_service(M,N,Msg) end)).stop() -> ring!stop.ring_service(M,N,Msg) -> Ring=ring_nod

2015-04-07 09:26:11 621

转载 shell入门

http://www.cnblogs.com/suyang/archive/2008/05/18/1201990.html 从程序员的角度来看, Shell本身是一种用C语言编写的程序,从用户的角度来看,Shell是用户与Linux操作系统沟通的桥梁。用户既可以输入命令执行,又可以利用 Shell脚本编程,完成更加复杂的操作。在Linux GUI日益完善的今天,在系统管理等领域,Shell编程仍然

2015-04-05 00:07:40 405

原创 CodeForces-233B-Non-square Equation

Description Let’s consider equation:x2 + s(x)·x - n = 0,  where x, n are positive integers, s(x) is the function, equal to the sum of digits of number x in the decimal number system.You are given an

2015-04-04 15:04:58 663

原创 CodeForce-245B-Internet Address

主要涉及字符串操作#include <iostream>#include <string>using namespace std;int main(){ freopen("input.txt","r",stdin); string str; string str2("ru"); while(cin>>str) { int len=str.si

2015-04-04 15:00:20 651

转载 more

more命令,功能类似 cat ,cat命令是整个文件的内容从上到下显示在屏幕上。 more会以一页一页的显示方便使用者逐页阅读,而最基本的指令就是按空白键(space)就往下一页显示,按 b 键就会往回(back)一页显示,而且还有搜寻字串的功能 。more命令从前向后读取文件,因此在启动时就加载整个文件。1.命令格式:more [-dlfpcsu ] [-num ] [+/ p

2015-04-02 22:37:46 418

转载 telnet

http://www.cnblogs.com/peida/archive/2013/03/13/2956992.html

2015-04-02 01:06:23 454

转载 rcp

rcp代表“remote file copy”(远程文件拷贝)。该命令用于在计算机之间拷贝文件。rcp命令有两种格式。第一种格式用于文件到文件的拷贝;第二种格式用于把文件或目录拷贝到另一个目录中。 1.命令格式: rcp [参数] [源文件] [目标文件] 2.命令功能: rcp命令用在远端复制文件或目录,如同时指定两个以上的文件或目录,且最后的目的地是一个已经存在的目录,则它会把前面指定的

2015-04-01 00:59:21 723

转载 scp

scp是secure copy的简写,用于在Linux下进行远程拷贝文件的命令,和它类似的命令有cp,不过cp只是在本机进行拷贝不能跨服务器,而且scp传输是加密的。可能会稍微影响一下速度。当你服务器硬盘变为只读 read only system时,用scp可以帮你把文件移出来。另外,scp还非常不占资源,不会提高多少系统负荷,在这一点上,rsync就远远不及它了。虽然 rsync比scp会快一点,

2015-03-31 01:17:04 391

原创 Erlang和C实现O(n)复杂度求中位数

方法类似于快速排序,只是它只处理单侧的情况。 Erlang:这里对于奇数和偶数都是求下中位数find_median([]) ->error;find_median(A) ->find_median(A,(len(A)+1) div 2).find_median([H|T],Idx) ->Len=len([X||X<-T,X<H]),

2015-03-31 00:48:33 796

原创 CodeRorce- Prizes, Prizes, more Prizes

这个题目比较简单,但是有些细节。 比如:50个输入,每个都是10^9,但是奖品最高价格为5. 那么奖品5的数量将会超过int的表示范围,所以cnt要用unsigned long long类型。#include <stdio.h>#include <string.h>typedef unsigned long long LL;int n;int points[60];int cost[5

2015-03-30 00:17:40 776

转载 Wget命令

Linux系统中的wget是一个下载文件的工具,它用在命令行下。对于Linux用户是必不可少的工具,我们经常要下载一些软件或从远程服务器恢复备份到本地服务器。wget支持HTTP,HTTPS和FTP协议,可以使用HTTP代理。所谓的自动下载是指,wget可以在用户退出系统的之后在后台执行。这意味这你可以登录系统,启动一个wget下载任务,然后退出系统,wget将在后台执行直到任务完成,相对于其它大

2015-03-30 00:07:08 387

原创 机器学习中的矩阵求导总结

下图为常见的矩阵求导公式及其推导。

2015-03-27 21:31:03 1499

原创 Word2vec Parameter Learning Explained 论文学习笔记

原始论文:http://www-personal.umich.edu/~ronxin/pdf/w2vexp.pdf 之前学习Word2vec时,脱离了神经网络,这周补充了下相关知识,打算之后再 看下源码,加深自己的理解。

2015-03-27 19:02:06 4637 1

原创 九度OJ-1107-搬水果

题目描述: 在一个果园里,小明已经将所有的水果打了下来,并按水果的不同种类分成了若干堆,小明决定把所有的水果合成一堆。每一次合并,小明可以把两堆水果合并到一起,消耗的体力等于两堆水果的重量之和。当然经过 n‐1 次合并之后,就变成一堆了。小明在合并水果时总共消耗的体力等于每次合并所耗体力之和。 假定每个水果重量都为 1,并且已知水果的种类数和每种水果的数目,你的任务是设计出合并的

2015-03-26 21:29:33 566

原创 九度OJ-1101-计算表达式

这个题目一行输入可能有多个表达式#include <stack>#include <stdio.h>using namespace std;char str[220]; //保存表达式字符串/*优先级矩阵,记人为添加在表达式首位的标记运算符为0号,+为1号,-为2号,*为3号,/为4号,若mat[i][j]==1则表示i号运算符优先级大于j号。*/int mat[][5]={

2015-03-26 00:10:34 829

原创 九度OJ-1108-堆栈的使用

题目描述: 堆栈是一种基本的数据结构。堆栈具有两种基本操作方式,push 和 pop。Push一个值会将其压入栈顶,而 pop 则会将栈顶的值弹出。现在我们就来验证一下堆栈的使用。 输入: 对于每组测试数据,第一行是一个正整数 n,0#include <stdio.h>#include <string.h>#include <stdlib.h>int n;char st

2015-03-25 23:27:00 718

SVM支持向量机算法的详细推导 详细到每个步骤 值得推荐 pdf

文档很不错,算法都由详细的推导,很好的入门材料。

2015-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除