自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (2)
  • 收藏
  • 关注

原创 #论文阅读#Amazon.com Recommendations: Item-to-item collaborative filtering

其实就是基本的item cf 的算法,和教材中讲的差不多,算法实现没有什么好赘述的,只是记录下在引言中看到的原来不知道的部分。首先是电商推荐面临的一些挑战,说的都是比较普遍的,但是其实针对不同的业务有不同的挑战: 数据量大:A large retailer might have huge amounts of data, tens of millions of customers ...

2019-04-12 20:11:05 687

原创 Pooled GRU + FastText 实现多标签的代码阅读

背景知识点embedingkeras Text Preprocessing Tokenizerkeras.preprocessing.sequence.pad_sequenceskeras.layers.Inputkeras.layers.Embeddingkeras.layers.SpatialDropout1Dkeras.layers.Densekeras....

2019-03-13 01:32:19 1776

原创 【论文阅读】Ranking Relevance in Yahoo Search

论文进行问题 -》 方法 -》 评价 -》 结论问题 - 商业检索问题:一般:相关性问题:基于文本 ---问题---》 query 和 doc 语义 上的 gap ; QA 系统中的 query understanding(个人感觉和第一个问题类似)基于用户行为 --问题--》 tail query转化率问题:时效问题距离问题.....用户体验:坏的...

2019-02-19 17:20:46 966

转载 牛客Java范例

牛客网华为笔试题通过案例,注意要引入包和输出: 1.import java.util.Scanner; public class Main { public static int getIntFromDouble(double a){ return (int)(a+0.5); } public static void main(String[

2017-08-27 19:40:41 3922

原创 常用算法 - 各种排序算法 - JAVA

其实做这个project的目的有二: 1. 工作笔试面试需要 2. 想在毕业之前自己做个小产品,圆了我自己的产品梦,哈哈。就当练练脑子吧。做的这个project,目前的想法是不仅有排序算法,希望最终可以集合各种常用算法的Java实现,有关图的啊,树的啊,各种启发式啊,贪心,动态规划,决策论之类的,等等等等吧。但这些都是本科时候觉得好玩自学的(我真的不是一个好的日语专业党。。),现在忘记的差不

2017-08-08 11:25:23 414

原创 《剑指offer》JAVA编程实现

持续更新。。。持。。。续。。。地址: https://github.com/GreenLiuWhy/AimAtOffer更新记录:2017年7月13日 && 版本一 && 加入第二章内容程序说明:下载导入项目即可运行。在我程序最头的注释里有 问题的题目其中的题目出现 proNum_Num 是 proNum 题目的扩展问题。比如 pro15_2 就是面试题15的第1个扩展问题。程序中包含 我自己的解

2017-07-13 19:25:03 376

原创 机器学习岗位面试问题汇总 之 集成学习

自己结合网络内容总结,欢迎指正欢迎补充。最新更新:20170626—版本1(只给出问题)总体性问题1.学习器结合可能带来的好处2.模型融合的方法/策略3.常见融合框架的原理;优缺点;融合一定会提升性能么?为什么融合可能会提高预测效果?4.Bagging 和 Boosting 的区别和联系5.为什么说Bagging是减少了方差(variance),而Boosting是减少了偏差(bias)?R F6.

2017-06-26 20:05:29 2780

原创 机器学习岗位面试问题汇总 之 SVM

自己结合网络、书本内容总结,欢迎指正欢迎补充。更新日期:20170607—版本11.简述SVM 二分类模型、更严格优化条件—>更好分界线,低维—->高维,间隔最大的分割平面,不太容易过拟合(2个原因),多层感知机(sigmoid核),3种分类,2种求解方法2.SVM的主要特点 (1)非线性映射-理论基础 (2)最大化分类边界-方法核心 (3)支持向量-计算结果 (4)小样本学习方法 (5)最终的

2017-06-24 21:59:04 4080

原创 机器学习岗位面试问题汇总 之 线性回归和LR模型

线性回归基本思想:用梯度下降法对最小二乘法行社的误差函数进行优化 几个式子:(1)假设 (2)优化目标 (3)梯度下降法(包括推导+特征缩放的目的) 优缺点:实现简单,但不能拟合非线性数据LR模型概念:分类、事件发生的概率、本质上是线性回归模型(解释为什么) 几个式子:(1)假设 (2)优化目标(推导) (3)梯度下降法(推导) 优点:实现简单,分类时计算量小、速度快、存储资源要求低 缺点

2017-06-21 17:16:21 5314

原创 机器学习岗位面试问题汇总 之 深度学习

1.模式识别、机器学习、深度学习的区别与联系 模式识别:过去、程序/机器做智能的事、决策树等 机器学习:热点领域、给数据+学习数据 深度学习:前言领域、强调模型2.早年神经网络被淘汰的原因 耗时、局部最优、竞争对手、over-fitting、参数3.深度学习的实质 及其 与浅层学习的区别 深度学习实质:多隐层+海量数据——>学习有用特征—–>提高分类或预测准确性 区别:(1)DL强调模型

2017-06-21 16:31:51 4646 1

原创 机器学习岗位面试问题汇总 之 总体性问题

自己结合网络内容总结,欢迎指正欢迎补充。最新更新:20170627—版本2(扩充问题,取消简易答案)1.机器学习、模式识别、深度学习的关系2.解释监督学习、非监督学习、半监督学习的关系3.机器学习模型分类 之 监督/非监督4.机器学习模型分类 之 回归/分类/标注5.机器学习模型分类 之 判别模型/生成模型6.生成模型、判别模型的区别?各自的优缺点?7.AUC的本质是什么?AUC有哪些

2017-06-05 18:03:05 661

原创 linux 和 windows 或 Linux 和Linux 之间互传文件 不管用不用虚拟机

参考:http://blog.163.com/netsafe_liulei@126/blog/static/52990159201191344354246/上面一文说了互传文件有三种方法:第1种  就是ftp,也就是其中一台Linux安装ftp Server,这样可以另外一台使用ftp的client程序来进行文件的拷贝;第2种 就是采用samba服务,类似Windows

2017-05-09 11:09:55 530

原创 Centos7中anaconda的安装配置之忘记添加环境变量怎么办-->XGboost安装-->vi退出

第一步:安装anacondahttp://blog.csdn.net/hh12211221/article/details/53743106第二步:忘记在添加path那里选择yes(骄傲脸)那么,我需要:第2.1步:添加环境变量:方法一:直接运行命令export PATH=$PATH:路径使用这种方法,只会对当前会话有效,也就是说每当登出或注销系统以后,PA

2017-05-02 21:22:02 2844

原创 Python-pandas常用函数

1、map()函数重点:对元素进行操作,作用集合和返回集合都是seriesAPI:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.map.html

2017-04-25 22:02:10 485

原创 Python-matplotlib常用函数

1.plot() http://matplotlib.org/2.0.0/api/pyplot_api.html#matplotlib.pyplot.plot

2017-04-19 17:03:11 497

原创 谷歌页面排序算法

论文地址: 百度学术上不去!!!相关博文: http://www.mahaixiang.cn/seoyjy/812.html http://www.mahaixiang.cn/seoyjy/5.html

2017-04-18 17:01:31 1378

原创 VMware虚拟机centOS7和主机win10的ping问题

如果错误出在win10--->centOS:http://jingyan.baidu.com/article/72ee561ab11933e16138dfc9.html错误出在centOS---->win10:http://jingyan.baidu.com/article/b907e627de34de46e7891c80.html

2017-04-14 14:57:56 5029

原创 python和java不同的地方

1.相对路径,绝对路径 http://www.cnblogs.com/zhangqigao/p/5756704.html

2017-04-13 10:35:53 447

原创 python的奇怪小地方 in numpy

1.array在计算的时候会向matrix转型,即: matrix<—operator(array,matrix)2.array()和getA() 两者都返回array类型,但array(Object)里面的对象可以是List,Tuple,matrix,甚至是array。 ar2=array(ar1)后,==:true, id():False getA()方法来自于

2017-04-12 18:58:31 512

原创 python字符串前面加u,r,b的含义

u/U:表示unicode字符串 不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。 一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。 建议所有编码方式采用utf8r/R:非转义的原始字符串 与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些,反斜杠加上对应字母,

2017-04-11 09:41:46 105295 5

原创 机器学习实战+统计学习方法之理解KNN(1.实战代码的详细走读和解析)

机器学习实战2.2.1:实施KNN算法# the program is general from 2.1.2~#_init_py is described is a 构造函数 constructed function'''wrong things: 1.gourp [ [],[] ] in the outermost the [] 2.dataSet.shape[

2017-04-10 21:32:54 847

原创 一个止步于64强的小白对于2017年华为挑战赛的总结(java+spfa+最小代价最大流+启发式算法)

因为舍友的邀请,参加了今年华为软件精英挑战赛,最后的成绩也不太理想,没进32强,但还是写个总结在这里吧。。。没有进入32强意味着我们只做了初赛试题,题目和数据在这里: http://codecraft.huawei.com/home/detail 题目实际上要求给出一个服务器配置问题。在满足消费者流量需求的前提下,给出花费money最小的流量服务器安置方案。题目中给出了全部网络节点的数目、边的数

2017-04-10 21:18:55 984

原创 有关windows环境下eclipse+PyDev+Python时候在Preferences找不到PyDev的错误示范和解决方案

必须写篇博客纪念下,一直用matlab,最近为了一个机器学期的比赛要用python编程,搭建这个环境就搭建了一天。主要问题是在Windows –>Preferences还是没有PyDev,重点说这个问题的解决方案。首先说PyDev插件安装的两种方法: 1. 直接让eclipse自己装: help –> Install New Software… ,输入下载的网站 http://pydev.org

2017-04-03 20:29:33 2573

原创 HashMap的clear()操作和new HashMap的时间效率比较

结论:看来分配内存都很耗时啊,也是用clear()比较快import java.util.*;/*在一个smallCostBigFunction()中就需要一个preRoud的clear操作, * 其中preRoud是全局变量,之所以用到全局变量,是因为smallCostBigFunction(),要将这个结果返回给dofire(), * 但它同时要给一个Cost给dofire(); * 这

2017-03-31 14:37:59 7222 1

原创 用for循环对int数组的赋值和用System.arraycopy()对int数组赋值的速度比较

结论:还是用for循环吧。/* * 测试输入赋相同值的速度: * 问题来源:spfa()算法每次都要对两个 length=802 的数组赋值,也就是没求一条最短路径就要赋值一次,也就是大概赋值300*40=12000次 * 结论:还是用for循环做吧 * output: * 用for循环做的赋值时间是:39用System.Arraycopy()循环做的赋值时间是:64*/public

2017-03-31 10:22:24 994

原创 java-smallwrong of ArrayList's copy

copy method, arraylist

2017-03-21 16:07:14 205

Surprise - Prediction Algorithms(预测方法)

其中的所有函数啥的

2017-07-20

陈天奇博士xgboost讲义

陈天奇博士xgboost讲义

2017-06-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除