自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 word2vec 原理与代码解析

已经看了很久的word2vec,但是发现了很多不同版本的解释,再加上原始论文没有提到太多的细节,所以打算直接看一遍源码,一方面可以加深自己理解;另一方面,以后也可以做适当的改进!  先给出源码中执行的流程图,按照流程图对代码进行详细的解读,流程图如下: 训练部分的流程图如下:  讲解将会按照这个训练过程来!(一)训练参数注意,这些参数都是全局参数,包括以下参数:...

2018-12-24 11:41:55 420 1

原创 基于Tensorflow实现DeepFM

 基于Tensorflow实现DeepFM前言DeepFM,Ctr预估中的大杀器,哈工大与华为诺亚方舟实验室荣耀出品,算法工程师面试高频考题,有效的结合了神经网络与因子分解机在特征学习中的优点:同时提取到低阶组合特征与高阶组合特征,这样的称号我可以写几十条出来,这也说明了DeepFM确实是一个非常值得手动撸一边的算法。当然,早就有一票人写了一车封装好的deepFM的模型,大家随便搜...

2018-11-19 18:49:25 576

原创 git pack has bad object at offset xxx: inflate returned -5

git clone 时出现错误,git 版本 git version 1.7.1,在git 版本(git version 1.7.11 )不存在此问题,这是git 的一个bug,升级git 后解决问题 git clone xxxInitialized empty Git repository in /data1/xxx.git/remote: Counting objects:

2017-11-23 16:46:01 6745 3

原创 使用sklearn 做分类试验(有附图)

#-*-coding:utf-8-*-"""CreatedonSunApr1908:57:132017@author: sishuyong"""print(__doc__)importnumpyasnpfromscipyimportinterpimportmatplotlib.pyplota

2017-10-18 14:17:11 970

转载 vim 配置成IDE

我的vim IDE界面: 1、安装Vim和Vim基本插件首先安装好Vim和Vim的基本插件。这些使用apt-get安装即可:lingd@ubuntu:~/arm$sudo apt-get install vim vim-scripts vim-doc其中vim-scripts是vim的一些基本插件,包括语法高亮的支持、缩进等等。vim中文帮助文档tar包下载地址:

2016-09-06 14:37:33 579 1

原创 linux 系统监控、诊断工具之 lsof 用法简介

目录:[ -]1、lsof 简介2、lsof 常用用法2.1 监控打开的文件、设备2.2 监控文件系统2.3 监控进程2.4 监控网络3、更多使用技巧3.1 监控用戶3.2 监控应用程序4、命令模式技巧4.1 组合逻辑查询条件4.2 lsof 命令的重复执行模式:5、最后的技巧6、refer: 1、lsof 简介

2016-08-23 15:26:22 1083

原创 各大推荐引擎 整理

最近在做一个推荐的任务,头绪繁多,回头看看同行的工作,希望能有些帮助。零零碎碎看过好多资料,有些已经忘记了,会慢慢补全。欢迎大家留言补充。也欢迎同行加我微博进行交流。(最近发现各家推荐技术进步很快,这里整理的可能已经是过去时了,不过最近不搞这个,没有精力补充了。)视频类Netflix:很多方法的融合,策略可以参考我翻译的blog,架构参考小鱼儿师

2016-07-12 10:47:37 2775

原创 linux 防火墙 iptables

linux 防火墙 iptables, 封杀单个IP的命令,和解封单个IP的命令。

2016-04-21 18:08:22 577

原创 linux load 监控,负载监控 ,shell 监控cpu,memory,load average,记录到log

linux load 监控,负载监控 。shell 监控cpu,memory,load average,记录到log,当负载压力时,发电邮通知管理员。

2016-04-19 14:45:02 4681 2

转载 Linux中gdb 查看core堆栈信息 gdb core 调试

gdb 调试以及生成的core dump 文件调试

2016-03-14 17:24:48 1019

转载 linux常用命令大全(转)

linux常用命令大全(转)由于记忆力有限,把平时常用的Linux命令整理出来,以便随时查阅: linux 基本命令 ls     (list 显示当前目录下文件和目录 ls -l 详细显示 =ll ) [root@linux ~]# ls [-aAdfFhilRS] 目录名称 [root@linux ~]# ls [--color={non

2014-08-26 16:54:12 986 2

转载 开源机器学习软件

今天给大家介绍一下经典的开源机器学习软件:编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源

2014-07-23 16:47:44 1114

转载 C/C++ 内存分配情况

一、C语言中的内存地址分配模型如   内存分配情况" title="C/C++ 内存分配情况" style="margin:0px; padding:0px; border:0px; list-style:none; width:509px; height:427px">1、程序代码区:存放函数体的二进制代码。  2、全局区数据区:全局数据区划分为三个区域。

2014-07-15 21:47:13 942

转载 C语言中内存分布及程序运行中(BSS段、数据段、代码段、堆栈)

C语言中内存分布及程序运行中(BSS段、数据段、代码段、堆栈)BSS段:(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。数据段 :数据段(data segment)通常是指用来存放程序中 已初始化 的 全局变量 的一块内存区域。数据段属于静态内存分配

2014-06-18 22:22:26 1649 1

原创 C++ 字符串问题

字符串在面试中经常会问到比如说1,一个字符串中重复出现的最长的子字符串   2,两个字符串求最长公共子串对第一个问题,本文写了自己实现的版本,功能实现了(但是不能保证时间复杂度),关键在于求一个字符串的全部 子字符串!1  找出  一个字符串中   重复出现的最长的  子字符串   void find_long_same_substr(){ string str,tep; c

2014-02-28 22:46:50 1130 1

原创 C++ 折半查找

1,C++实现折半查找v 中元素假设是有序的void binary_search(vector v,int x){ int low=0; int high=v.size()-1; int mid=(low+high)/2; while(high>=low) { if(v[mid]==x) { cout<<"最终的找到位置是 "<< mid; break;

2014-02-28 17:03:27 978

原创 C++ 排序算法总结 堆排序 快速排序

1,堆排序思路// lianxi.cpp : 定义控制台应用程序的入口点。//自己实现的堆排序,主要在于堆的调整,以及边界控制条件#include "stdafx.h"#include #include using namespace std;int _tmain(int argc, _TCHAR* argv[]){ int a[11]={12,2,35,65,5,52

2014-02-28 15:43:12 962

原创 常见面试题 总结

1 ,约瑟夫问题约瑟夫问题是个有名的问题:N个人围成一圈,从第一个开始报数,第M个将被杀掉,最后剩下一个,其余人都将被杀掉。例如N=6,M=5,被杀掉的人的序号为5,4,6,2,3。最后剩下1号void Josephus(int x,int m){ //x代表总共的节点数,m为从头开始数到m ,删除掉m 后,从m的下一个位置开始从1计数 node *p=new node(); p

2014-02-27 21:56:58 780

原创 C++ 单链表的 就地逆置 ,以及基本操作

#include "stdafx.h"#define sub(a,b) a-b //没用#include using namespace std;struct node{ int a; node * next;};int _tmain(int argc, _TCHAR* argv[]){ //int x=sub(3,8); node * createList

2014-02-26 09:13:35 2919

原创 判断点是否在三点围成的三角形内

#include "stdafx.h"#include #include#include using namespace std;struct point{double x,y;};//求边长void Compute(point A,point B,point C,double &a,double &b,double&c){a=sqrt( pow(A

2013-12-30 22:31:08 1229

原创 互联网世界的“人工智能”——探秘“深度学习”的前世今生

互联网世界的“人工智能”——探秘“深度学习”的前世今生编者按:本文来自“流浪汉”投稿(@ZhangLumin),一个在硅谷工作的码农,有机器学习背景,平常对产品方面很有兴趣。最近一段时间里,Facebook、Google、Yahoo!、百度等各大公司都在尝试将深度学习(deep learning)算法运用到产品开发中,以期使产品更智能化,提升用户体验。在深度

2013-12-19 23:41:42 982

转载 FP-Tree思想与实现

在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。支持度和置信度严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓的“支持度”比较高的项集,下面解释一下支持度和置信度的概念。设事务数据库为:

2013-12-07 19:12:52 1296

转载 常见面试之机器学习算法思想简单梳理

常见面试之机器学习算法思想简单梳理前言:  找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。

2013-12-03 16:21:44 1192

原创 EM算法 自己整理(有待扩展)

EM写的很好的文章:   http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

2013-12-01 21:43:19 1081

转载 深度学习简介

查看最新论文Yoshua Bengio, Learning Deep Architectures for AI, Foundations and Trends in Machine Learning, 2(1), 2009深度(Depth)从一个输入中产生一个输出所涉及的计算可以通过一个流向图(flow graph)来表示:流向图是一种能够表示计算的图,在这种图中每一个

2013-11-30 20:21:26 1170

原创 最重要的一些算法 (数学与计算机领域)

今天在微博上无意间发现了好心人翻译的中文版,好东西贴过来奥地利符号计算研究所(Research Institute for Symbolic Computation,简称RISC)的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是计算机科学家,他请这些科学家投票选出最重要的算法,以下是这次调查的结果,按照英文名称

2013-11-27 21:04:32 1254

原创 vs2010 c++ 链接mysql

第一步 建立连接前的配置来源是mysql的官网配置文件 :http://dev.mysql.com/doc/refman/5.6/en/connector-cpp-apps-windows-visual-studio.html(1)在c++项目->属性-> 配置属性->c/c++->常规->附加包含目录  包括进   C:\Program Files\MySQL\MySQL Server

2013-11-27 13:17:24 1164

转载 大数据应用之个性化推荐的十大挑战

源地址   : http://www.kddchina.com/article-49-1.html个性化推荐很多人都知道,但其中不乏认识上的误区。有的人觉得个性化推荐就是细分市场和精准营销,实际上细分市场和精准营销往往是把潜在的用户分成很多群体,这固然相比基于全体的统计有了长足的进步,但是距离“给每一个用户量身定做的信息服务”

2013-11-24 22:29:12 1678 1

转载 Trie树 的理论与实现

性质它有3个基本性质:根节点不包含字符,除根节点外每一个节点都只包含一个字符; 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串; 每个节点的所有子节点包含的字符都不相同。2基本操作其基本操作有:查找、插入和删除,当然删除操作比较少见。我在这里只是实现了对整个树的删除操作,至于单个word的删除操作也很简单。3实现方法搜索字典项目的

2013-11-24 14:34:36 1034 1

原创 数据挖掘 fp-growth 算法 频繁模式挖掘

class treeNode: def __init__(self, nameValue, numOccur, parentNode): self.name = nameValue self.count = numOccur self.nodeLink = None self.parent = parentNode

2013-11-10 21:30:47 3128 1

原创 分类

// new_keyword_extract1.0.cpp : 定义控制台应用程序的入口点。//#include "stdafx.h"//boost库的静态链接问题//#include #include #include #include #include  #include #include #include

2013-11-04 21:33:49 788

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除