- 博客(249)
- 资源 (9)
- 收藏
- 关注
原创 机器学习基础知识(五)--- FTRL一路走来,从LR -> SGD -> TG -> FOBOS -> RDA -> FTRL
在线学习算法FTRL
2016-05-02 19:32:34 42872 16
原创 机器学习基础知识(四)--- 从gbdt到xgboost
gbdt(又称Gradient Boosted Decision Tree/Grdient Boosted Regression Tree),是一种迭代的决策树算法,该算法由多个决策树组成。它最早见于yahoo,后被广泛应用在搜索排序、点击率预估上。 xgboost是陈天奇大牛新开发的Boosting库。它是一个大规模、分布式的通用Gradient Boosting(GBDT)库,它
2016-04-09 19:34:15 32203 10
原创 机器学习基础知识(三)--- spark学习笔记
Scala是一门多范式的编程语言,一种类似java的编程语言[1],设计初衷是实现可伸缩的语言[2]、并集成面向对象编程和函数式编程的各种特性。
2016-01-04 11:34:55 1443
原创 机器学习(二)--- 分类算法详解
感觉狼厂有些把机器学习和数据挖掘神话了,机器学习、数据挖掘的能力其实是有边界的。机器学习、数据挖掘永远是给大公司的业务锦上添花的东西,它可以帮助公司赚更多的钱,却不能帮助公司在与其他公司的竞争中取得领先优势,所以小公司招聘数据挖掘/机器学习不是为了装逼就是在自寻死路。可是相比JAVA和C++语言开发来说,机器学习/数据挖掘确实是新一些老人占的坑少一些,而且可以经常接触一些新的东西。还是赶紧再次抓住机
2015-09-20 15:47:04 70421 4
原创 计算广告学漫谈
计算广告学是一个十分庞大的学科,里面涵盖了自然语言处理、机器学习、推荐系统等众多研究方向。而且广告作为互联网行业的三大盈利模式(广告、电商、游戏)之一,也是这三大模式中最有技术含量的,计算广告学一直都吸引着无数学术界/工业界的精英投入其中(ps:计算广告学也是机器学习在商业界最成功的应用之一)。计算广告学的海洋如此浩瀚,以至于其中的任何一个研究方向都足够一个人研究很多年。在长年累月的参考各种计算广
2015-03-02 19:29:19 7235
原创 leetCode 解法集锦
博弈(对手转化为当前、位运算,计算两者之差)求和:前缀和+字典;同时保留最大值和最小值,求和最终计算。决策数字到可选+1,然后是倍数。原地存储(原地取反)、字符串处理。同时保留正序列和负序列,迭代计算。递归、动态规划、位运算去重。
2023-11-09 18:08:25 172
转载 神经网络深度学习(七)排序推荐进阶pairwise/listwise损失函数
pairwise 方法通过考虑两两文档之间的相关度来进行排序,有一定进步。
2022-09-19 00:52:42 2883
转载 NLP基础知识整理
目录一、生成模型 VS 判别模型一、生成模型 VS 判别模型从概率分布的角度考虑,对于一堆样本数据,每个均有特征Xi对应分类标记yi。生成模型:学习得到联合概率分布P(x,y),即特征x和标记y共同出现的概率,然后求条件概率分布。能够学习到数据生成的机制。判别模型:学习得到条件概率分布P(y|x),即在特征x出现的情况下标记y出现的概率。数据要求:生成模型需要的数据量比较大,能够较好地估计概率密度;而判别模型对数据样本量的要求没有那么多。https://blog.csdn..
2021-06-20 01:15:23 1134
转载 NLP概览---NLP 学习
1. 什么是NLP自然语言处理 (Natural Language Processing) 是人工智能(AI)的一个子领域。**自然语言处理是研究在人与人交互中以及在人与计算机交互中的语言问题的一门学科。**为了建设和完善语言模型,自然语言处理建立计算框架,提出相应的方法来不断的完善设计各种实用系统,并探讨这些实用系统的评测方法。2. NLP主要研究方向**信息抽取:**从给定文本中抽取重要的信息,比如时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解.
2021-03-19 00:49:02 938
原创 JAVA练级之路(一)--- JAVA环境配置
一、JAVA环境配置: 1. jdk 1.7 安装: 2. maven安装: 3. idea安装 4. scala环境配置 二、使用idea创建工程 http://www.oracle.com/technetwork/java/javase/downloads/index-jsp-138363
2016-01-17 23:46:44 805
原创 C++编程(四)--- 代码规范
1、变量命名规范作用域命名规范前缀说明无局部变量m_类成员变量(member)sm_类的静态成员变量s_静态变量g_全局变量sg_全局静态变量HttpFile *_pi
2016-01-17 23:16:10 983
原创 查询纠错、查询提示与意图识别
今天我们动手实现了一个查询纠错和查询提示的代码: 1. trie树代码如下:def build_trietree(root, str1): p=root; for i in range(0, len(str1)): if( p.has_key(str1[i]) ): p = p[str1[i]]; pri
2015-11-29 00:47:12 1594
原创 C++编程 (三)--- 深入C++后台开发
搞了很久搜索了,可是做的很多都是业务逻辑和PM的需求,也没有高大上的技术,我也认真总结和实践了一些深入的技术。总的来说C++后台开发深入一些的有网络编程、多线程编程、进程/线程同步/通信和调度、动态链接库使用、常用的框架的深入阅读和理解、常用的运行时程序问题排查(内存泄露、无法响应新的请求)、分布式系统的使用、高并发系统优化。所以本文一共分为如下九个部分:一、网络编程二、多线程编程三、
2015-10-28 18:11:12 11572 1
原创 算法知识分类集锦
本文中作者收集了基础的算法题目,并对他们进行分类整理。仔细思考常用算法,发现它们的考察知识点也是固定的,常用的知识点有:组合数学、线性规划、概率论、数论、动态规划、空间换时间、递推等思想。所以本文的目录如下:一、组合数学题目二、线性规划题目三、概率论题目四、动态规划题目五、空间换时间题目六、递推找规律题目七、利用已有算法特性的题目一、组合数学面试题目
2015-09-03 13:40:07 1359
原创 JAVA练级之路(二)--- JAVA入门
本文主要介绍了C++/JAVA比较、JAVA相关工具配置、JAVA语言基础。主要目录如下: 一、C++&JAVA对比。 二、JAVA工具配置: IDEA使用、pom.xml说明、mvn使用。 三、JAVA语言特性:一、C++&JAVA对比。 文章开始之前,先对比一下C++和JAVA语言吧。(下面的介
2015-08-30 20:43:40 727
原创 C++编程(五)--- Cmake详解&Makefile详解
C/C++程序员肯定离不开Makefile和Cmake,因为如果对这两个工具不熟悉,那么你就不是一个合格的C/C++程序员。本文对Makefile和Cmake,及它们的使用进行了详细的介绍,本文的目录如下:一、Makefile详解 1.1 Makefile语法 1.2 Makefile示例二、Cmake详解 2.1 Cmake语法 2.2 Cmake
2015-08-25 00:34:24 9405
原创 搜索引擎之路(一)--- 《搜索引擎---信息检索实践》(读书笔记)
搜索引擎是指根据一定的策略,运用特定的计算机程序从互联网上收集,在对信息进行组织和处理后,为用户提供检索服务,并将检索相关的信息提供给用户的系统。搜索引擎的研究方向包含架构方向(索引、检索),策略方向(排序、查询与结果处理)。本文简要总结了搜索引擎---信息检索实践的阅读笔记和工作中的一些理解。本文的主要目录如下:一、搜索引擎架构二、搜索引擎评价标准三、搜索引擎索引和检索逻辑四、搜
2015-08-10 00:26:27 2216
原创 C++编程 (二)--- GDB使用指南
GDB是linux下命令行程序调试的工具,这也为程序开发和调试带来了极大的便利。使用命令行的优势在于,它们可以很方便的集成在一起,使用几个简单的已有工具,就可以做出强大的功能。图形化界面和命令行可谓是尺有所短寸有所长吧,如果你习惯命令行操作,并且对命令熟知的话,使用GDB调试是十分高效的。 一般来说GDB主要帮你完成如下四个方面的功能: 1. 启动你的程序,可以按照你的
2015-06-29 23:04:28 1077
原创 浅析shell编程
shell诞生于Unix,是与unix/linux交互的工具。shell 编程指令简单、灵活、高效;可移植性高;可以实现自动化管理,它特别适合处理一些小问题。本文会尝试总结一些常用的shell编程指令和学习一些增加编程效率的技巧,并把目录分为shell编程基础、文本处理、文件处理、系统管理类、用户管理类、其他指令和遇到的一些问题,共七部分分别进行介绍。 所谓磨刀不误砍柴工吧,
2015-05-12 22:06:24 921
转载 职场人生18个哲理故事
一 去过庙的人都知道,一进庙门,首先是弥陀佛,笑脸迎客,而在他的北面,则是黑口黑脸的韦陀。但相传在很久以前,他们并不在同一个庙里,而是分别掌管不同的庙。 弥乐佛热情快乐,所以来的人非常多,但他什么都不在乎,丢三拉四,没有好好的管理账务,所以依然入不敷出⾀‚而韦陀虽然管账是一把好手,但成天阴着个脸,太过严肃,搞得人越来越少,最后香火断绝。 佛祖在查香火的
2014-09-18 21:08:02 752
原创 基于samba的windows与linux共享/基于cwRsyncServer的windows与linux共享
1. 基于samba的windows与linux共享,
2014-08-12 16:40:17 583
Modelsim6.5 license
2010-04-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人