自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 pandas提取键值对(json和非json格式)

pandas提取键值对信息,包括json和非json格式

2022-11-20 01:40:10 1069 1

原创 强化学习面试题大全

强化学习面试题大全(持续更新)

2022-03-20 13:05:24 2484 2

原创 Large-Scale Order Dispatch in On-Demand Ride-Hailing Platforms: A Learning and Planning Approach论文精读

Large-Scale Order Dispatch in On-Demand Ride-Hailing Platforms: A Learning and Planning Approach论文来源:滴滴,KDD CUP2018主要涉及方法:马尔科夫决策过程(MDP)、KM算法。本篇也是出行领域非常经典的一篇派单算法,有必要精读!参考解读https://mp.weixin.qq.com/s/rRRYDoeUfiDmDwj_3hKz5A (赞!)http://www.arvinzyy.cn/

2022-03-20 00:13:50 2335 2

原创 滴滴技术公众号-算法文章汇总

滴滴技术公众号-算法文章汇总

2021-12-16 15:34:11 673

原创 2021年秋招算法岗面经-无人驾驶领域\slam\点云方向-百度\字节\旷视\商汤\文远知行\美团\高德\地平线\华为

(欢迎大家关注我的微信公众号“机器学习面试基地”,之后将在公众号上持续记录本人从非科班转到算法路上的学习心得、笔经面经、心得体会。未来的重点也会主要放在机器学习面试上!)更多无人驾驶领域\slam\点云方向技术文章可以关注CSDN账号bh_宫商角徵羽,一个立志要为中国的自动驾驶奋斗终身的boy: https://blog.csdn.net/weixin_38133509?spm=1001.2014.3001.5509百度一面讲项目用过哪些传统点云处理方法C++的数据结构熟吗vector和l.

2021-10-29 10:44:57 2314 1

原创 2021字节秋招算法岗面经——抖音推荐

2021字节秋招算法岗面经一面过(一个小时)讲实习实习的结果是如何评估的为什么用AUC,而不用别的AB测试时,为什么是基于用户划分,而不是基于司机划分最大池化的反向传播求导公式LSTM解决了什么问题通用的提高模型泛化能力的方法(解决过拟合的方法)二面20210922(一个小时)自我介绍先做道题吧:矩阵中的路径 https://leetcode-cn.com/problems/ju-zhen-zhong-de-lu-jing-lcof/然后有个待优化点是,输入的是一个字符串数组

2021-10-18 15:48:23 752

原创 LSTM模型在测试集上的输出全都是一样的怎么办

为什么LSTM模型在测试集上的输出全都是一样的?答:输入的幅值太大了!!把输入幅度缩放到0到1里去!!!

2021-09-10 17:28:39 3261 4

原创 图解LSTM——一文吃透LSTM

图解LSTM——一文吃透LSTMv0版(20210817):本版本将通过图解LSTM的方式,逐步剖析LSTM的内部结构,力求把LSTM的结构和公式刻在大家的脑海中。当前版本并不会对LSTM的有效机制原因和反向传播进行分析,重点在于LSTM的结构展现上,也不会牵扯别的太多,就一个目的,让大家看透“LSTM”。一、理解第一步:宏观认识LSTM能干什么?简单说,就是将一串向量序列,转换为另一串含有更多特征信息的向量序列,也可以理解为embedding的一种方式。在实际应用中,输入的可以是一维的信号

2021-08-17 00:25:59 11224 11

原创 机器学习面试题hot50(一)

<h2 id="1、什么是过拟合,如何解决过拟合?">1、什么是过拟合,如何解决过拟合?</h2><ul><li>首先,过拟合就是在训练集上表现明显好于在验证集或测试集上的表现。在训练损失曲线中,

2021-06-24 15:42:57 116 1

原创 机器学习算法岗实习面经-探探、阿里、京东

小广告后续会进一步补充上述面经的参考回答,然后放在自己的公众号“机器学习面试基地”中,公众号刚开,内容不多,但是会慢慢更新,主要围绕着机器学习面试进行展开,补充常考题目、面试套题等等,包括自己准备找实习的过程中整理的一些资料实习面试记录概览共面试了探探(一面挂)、阿里(HR面)、京东(半路放弃)三家公司面试阶段个人情况介绍学历:985本硕、非科班论文:一篇非AI领域的SCI在投(但是用到了深度学习)项目:两个将深度学习应用在其它领域的项目(面试探探时写了王喆老师的一个推荐系统项目,后

2021-06-22 15:52:38 480

原创 《A Taxi Order Dispatch Model based On Combinatorial Optimization》论文精读及笔记

A Taxi Order Dispatch Model based On Combinatorial Optimization /基于组合优化的出租车订单调度模型论文来源https://dl.acm.org/doi/pdf/10.1145/3097983.3098138KDD cup滴滴团队中文参考:https://baijiahao.baidu.com/s?id=1575765326502914&wfr=spider&for=pc辅助资料:https://blog.csdn.

2021-06-21 09:38:31 530

原创 电影推荐系统Sparrow Recsys源码解读——FeatureEngineering部分

特征工程部分的代码。对电影数据进行特征处理。代码内容包含:对类别标签进行one-hot编码,以及multi-hot编码,以及数值特征的处理package com.wzhe.sparrowrecsys.offline.spark.featureengimport org.apache.log4j.{Level, Logger}import org.apache.spark.{SparkConf, sql}import org.apache.spark.ml.{Pipeline, Pipeli

2021-02-11 00:49:57 855 6

原创 电影推荐系统Sparrow Recsys源码解读——FeatureEngForRecModel部分

import org.apache.log4j.{Level, Logger}import org.apache.spark.SparkConfimport org.apache.spark.sql.expressions.{UserDefinedFunction, Window}import org.apache.spark.sql.functions.{format_number, _}import org.apache.spark.sql.types.{DecimalType, FloatTy

2021-02-11 00:43:24 990 2

原创 AUC的三种计算方法

面积计算法,直接计算ROC曲线下的面积。利用一个变量来记录每个矩形的高度,正例时只增加高度,只有遇到负例曲线往右走时才累加面积。其实这样的计算方式是很简洁的,但是不能应对概率相等的情况。比如对于一个正样本和一个负样本,他们被预测为正的概率都是0.8,那么它们的排序关系就很重要了,把正样本排在前面和负样本排在前面对应的是两种不同的曲线,得到的曲线面积AUC自然也就是不相同的,因此网上大多都没有采用面积计算法。```def my_auc_calculate(labels,preds): pos_..

2021-01-28 16:48:12 6185

原创 电影推荐系统Sparrow Recsys源码解读

//这里的flatMap是先对集合中每个元素进行操作然后再扁平化,而不是直接扁平化。//匿名函数逻辑:输入sample,输出成对序列pairSeq。先初始化输出pairSeq,以及初始化pair的前一个元素//if(previousItem != null)其实就代表着从第二个元素开始循环//:+表示在序列的屁股后面进行拼接//逻辑很好理解,关键是得习惯foreach, =>, :+这些自己不熟悉的操作 def generateTransitionMatrix(samples : RDD[

2020-12-15 00:55:57 2777 4

原创 深度学习推荐系统实战笔记

Sparrow Recsys的安装与运行IDEA的安装下载地址:直接百度即可安装教程:百度一大堆https://blog.csdn.net/m0_37220730/article/details/107589690

2020-12-02 00:05:03 3595 3

原创 赛事学习-零基础入门推荐系统-新闻推荐(二)

这部分主要是学习这一类任务的数据分析方法,其次就是pandas的使用,感觉pandas要是用不好,数据根本就分析不起来。这一节就直接把学习的代码放上来吧!以后有了新的经验了再来总结。数据分析# 导入相关包%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rc('font', family='SimHei', size=1

2020-11-27 23:47:08 190

原创 赛事学习-零基础入门推荐系统-新闻推荐(一)

个人吐槽:到时候暑假可能不能去实习了,得给自己找找后路,希望自己明年能在比赛上得到一个好成绩吧。这次报了datawhale的组队学习,希望可以督促自己。赛题理解目的:根据用户历史浏览点击新闻文章的数据信息预测用户未来的点击行为, 即用户的最后一次点击的新闻文章,或者说为根据用户历史浏览点击新闻文章的数据信息为其进行推荐。类型:APP中的新闻推荐数据:该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表

2020-11-21 20:28:18 700 4

原创 拉格朗日法与对偶问题的个人理解

拉格朗日对偶性的个人理解该部分是svm的理解基础https://www.cnblogs.com/dreamvibe/p/4349886.html(可参考)https://zhuanlan.zhihu.com/p/38182879(也可以去参考李航的统计学习方法中的附录部分)https://www.zhihu.com/question/58584814O(可参考)我们的问题针对的是下面的优化问题,在等式约束和不等式约束的情况下求函数的最小值。min⁡x∈Rnf(x) s.t. 

2020-10-30 15:49:38 225

原创 ROC曲线的个人记法

自己老是容易记混,现在想个比喻的方法来加深自己的记忆:首先有一堆样本,这堆样本里有正样本和负样本。现在把正样本看成警察团体,负样本看成卧底团体。现在模型对所有人进行了评估,给每个人打了一个是真警察的概率。然后按照这个给概率让大家排队。现在按照排队顺序给大家颁发警察证书。那么AUC曲线里的纵轴,也就是召回率,关注的就是这些真警察,有哪些已经被颁发了证书,比例是多少。而横轴关心的就是这些卧底,看有多少卧底被颁发了证书,比例是多少。也就是误判。画图曲线:一开始当然大家都没有证书,所以肯定都是0,到最后大

2020-10-22 09:53:07 162

原创 推荐系统概述

(参考自datawhale十月组队学习教程、深度学习推荐系统,推荐系统实践等)推荐系统概述什么是推荐系统?用户层面:推荐系统是一种帮助用户快速发现有用的或者感兴趣的信息的工具。公司层面:推荐系统是一种增加公司产品与用户接触,购买等行为概率的工具。(白话版:把公司想要投放的信息(比如广告和商品)投放给最可能感兴趣的用户,增加用户的点击率或者购买率等等)什么时候使用推荐系统?用户层面:推荐系统通常用于信息过载或者用户没有明确目标的情形。公司层面:同样应该在公司有过载的信息以及足够大的用户

2020-10-17 23:17:26 466 1

原创 如何去除matlab存图时的白边

在imshow()或者imagesc()画图语句的后面添加下面两句:set(gcf,'Position',[300 300 500 500]); set(gca,'Position',[0 0 1 1]); ‘position‘表示图像位置:对于gcf,position后面指定的位置[nums1 nums2 nums3 nums4]中,(nums1,nums2)表示figure对象(画出来的整个展示界面除了工具栏部分)的左下角在电脑界面上的坐标,nums3,num4则表示figure图像的长和宽。单

2020-09-29 20:37:23 5383 2

原创 matlab自带的函数被新安装的工具包的同名函数覆盖了的解决办法

我的场景:smooth函数被k-wave工具包的smooth函数覆盖了。解决办法:1、在帮助里搜索smooth2、去matlab文件夹里面找到这个函数(看下图的文件夹位置,先找到toolbox),然后复制那个函数文件(.m)。3、粘贴到自己想要使用的文件夹...

2020-07-06 12:32:41 4724 1

原创 scihub下载太慢或者无法加载的问题

步骤一:进入scihub网址步骤二:搜索想查找的文章步骤三:搜索页面出来后(比如等待加载的页面,或者无法加载pdf的页面),复制链接到迅雷步骤四:点击左边的save,等待下载即可然后就会冒出来迅雷的下载链接啦如果是下面的情形,应该是scihub里没有,或者名字打错了:...

2020-05-30 09:44:38 11657 1

原创 论文撰写中的公式问题

应当注意的点矩阵、向量应该加粗,上下标应该不用跟着加粗对应元素相乘应该用⊙\odot⊙。这一点深受网上的博客误导,比如一次写LSTM相关的论文时,百度发现最火的图基本都长下面的样子:这样其实时很容易引起别人误解的。不仅如此,很多公式也出现了不好的表达,博客里有许多这种表达:Ct=ft∗Ct−1+it∗C~tC_{t}=f_{t} * C_{t-1}+i_{t} * \tilde{C}_{t}Ct​=ft​∗Ct−1​+it​∗C~t​。当然只是为了通俗理解是没有问题的,但是好多论文里也出现了不好的表

2020-05-26 11:04:11 12125

原创 深度学习与医学成像

目前深度学习在医学成像中的应用,主要分为以下四种:1、第一种是应用最为广泛的图像后处理,输入传统方法的重构结果然后利用CNN网络进行改进,优点是可以将大量的深度学习在图像领域的工作移植过来,缺点是不能充分利用到原始投影数据。2、第二种是直接重构,即直接利用神经网络学习投影数据到重构图像之间的映射,该方法可以充分利用到投影数据,该方法往往需要利用全连接层来学习投影数据到重构图像的映射,然而这样的...

2020-04-29 00:13:39 3277

原创 线性回归、逻辑斯蒂回归、神经网络的区别

主要记一下逻辑斯蒂和神经网络的区别吧

2020-04-23 23:30:25 1568

原创 逻辑斯特回归的公式推导

逻辑回归(logistic regression)逻辑回归的代价函数为:cost⁡(θ,y)=−ylog(hθ(x))−(1−y)log(1−hθ(x))\operatorname{cost}(\theta,y)=-ylog(h_\theta(x))-(1-y)log(1-h_\theta(x))cost(θ,y)=−ylog(hθ​(x))−(1−y)log(1−hθ​(x)) 其中yyy为...

2020-04-08 11:34:43 443

原创 c++多态相对于重定义的好处

这里先记一下这个问题,学的过程中很疑惑,因为自己是先学的python, python中的继承大部分都是重定义,所以比较好奇多态的有什么好处,为什么不用重定义而要用多态?...

2020-04-03 13:44:41 334

原创 标准差、方差、协方差、协方差矩阵、均方差、均方误差

记录一下统计学的各种差吧,不然老是被搞晕,不断补充中……

2020-03-25 16:11:23 822 1

原创 如何理解卡尔曼滤波(附matlab代码)

简单概括卡尔曼滤波是一种最优估计,也就是从测量信号中提取出有用信号。它的特点在于它并不是只通过当前的测量信号来预估信号,因为测量信号也可能是不准确的,它是有一定误差范围的,因此卡尔曼滤波还结合了被测系统自身的性质,给出了一个预估值,最后通过结合测量值和预估值得到最优结果。因为测量值和预估值都是有一定误差范围的,并且误差是符合某种分布的,因此卡尔曼滤波的精髓(那些麻烦的方程)就是如何根据两者的...

2020-03-25 11:40:53 829

原创 显卡驱动版本、cudatoolkit版本、cudann版本、tensorflow-gpu版本之间的对应关系

专门记一篇它们之间的关系,自己都老忘记。这篇主要针对想要安装tensorflow但又搞不清楚它们之间的关系的童鞋们。先来简单区分一下它们:显卡:一块硬件,真正干活的劳动力,GPU显卡驱动(Driver):首先显卡驱动是每个人的电脑上只要有显卡就有的东西,也就是你不搞深度学习,你的电脑也会用到,比如游戏啊之类。简单来说就是,你电脑上有个显卡,这玩意就是让这显卡动起来的东西,没这玩意,显卡不知...

2020-02-08 19:10:19 15350 5

原创 Bug:No module named ‘pytest‘

在测试模型时遇到Bug:No module named ‘pytest’我的场景:pycharm下运行一个测试深度学习模型的python代码。我的代码名称为test_exp.py出现bug的原因:.py文件的开头出现了test这个单词。之所以是强调开头,是因为我重新尝试了一下model_test的文件名,是可以通过运行的注意是test这个整体,如果是testr,testpp等等都是不会报...

2020-02-08 17:57:18 23580 4

原创 c++之丢人bug汇总

终于开始看《c++ primer plus》了,之前好不容易在vscode上配置好了c++的环境,结果书上的第一个代码就GG了。代码如下:#include <iostream>int mian(){ using namespace std; cout << "try yi xia"; cout << endl; ...

2020-01-29 20:02:05 440

原创 pytorch下载太慢的解决办法

最强方案1、本地端关掉wifi,手机开个4G热点,电脑连上即可(建议先把wifi可以快速下载的附加包下载完,下载过慢或者无法下载的方法再用手机流量来下)手机流量少的慎用!!!!!!!!!!!!!!!!!!2、远程连接的服务器这个时候如果关掉wifi,就和服务器断开了。这时候建议先用4G下载好离线安装包,采用离线安装的方式。...

2019-10-23 12:24:27 59365 27

原创 Win10上的tensorflow-gpu版本安装记录

Win10上的tensorflow-gpu版本安装记录这里记一下Windows下tensorflowGPU版的安装过程:(首先GPU版的麻烦在于cuda的版本问题。需要知道的有:cuda有驱动版本和运行版本,我们平时下载的cudatoolkit可以理解为运行版本,而驱动版本可以理解为NVidia的驱动版本。驱动版本需要满足一个条件就是,必须大于等于运行版本,比它强这样才能驱动起来嘛,它是向后兼...

2019-08-20 15:42:51 118

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除