自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 问答 (5)
  • 收藏
  • 关注

原创 如何将python训练的XGBoost模型部署在C++环境推理

对通过python训练得到XGBoost模型,进行C++推理

2023-02-18 22:14:14 1337

原创 从零开始的otto推荐系统竞赛体验与总结

otto数据集是一个用于多目标推荐研究的大规模数据集,来源于otto网站和程序中的匿名行为日志,主要包含用户(session)与物品(aid)之间的交互行为,我们需要根据用户历史行为数据,预测用户之后会对哪些物品进行click(点击)、cart(添加购物车)、order(下订单)三种类型的操作。

2023-02-04 15:36:56 1490

原创 如何实现多个不同目录下的Anaconda软件环境切换

多个不同目录下的Anaconda软件环境切换方法

2022-11-25 14:55:06 1627

原创 论文阅读笔记 On Mitigating Hard Clusters for Face Clustering (ECCV2022)

On Mitigating Hard Clusters for Face Clustering (ECCV2022) 论文阅读笔记

2022-10-09 20:34:46 349 1

原创 在Ubuntu系统上安装nvidia driver和cuda toolkit

1.Ubuntu上安装nvidia driver在https://www.nvidia.com/Download/index.aspx上根据系统版本和显卡的型号选择适合的驱动进行下载下载驱动软件完成后,如我下载的是NVIDIA-linux-x86_64-470.94.run,将其设置为可执行文件:sudo chmod +x NVIDIA-linux-x86_64-470.94.run按下CTRL + ALT + F1进行命令行界面卸载本机上的nvidia driver:sudo nvidia-un

2022-01-07 16:14:03 1973

原创 pytorch训练遇到“libgcc_s.so.1 must be installed for pthread_cancel to work”解决办法

关于这个问题,目前没找到一个具体的解决办法,但是通常可以通过python/torch版本回退来规避这个问题。如果你用的是python3.8及以上版本,可以尝试将它降到3.7及以下版本,可参考:python - libgcc_s.so.1 must be installed for pthread_cancel to work - Stack Overflow或者通过回退torch的版本,可参考:https://github.com/pytorch/pytorch/issues/41661...

2021-11-12 15:51:49 4189

原创 如何远程在服务器环境中使用jupyter notebook

如何远程在服务器环境中使用jupyter notebook在服务器端启动jupyter notebook,并指定端口号jupyter notebook --port=48888 --no-browser在本地环境中使用ssh指令连接并实现本地和远程端口映射ssh -N -f -L localhost:6688:localhost:48888 username@ip-N :SSH没有命令要被远程执行; -f :SSH在后台执行; -L 是指定端口映射,远程端口是48888,本地的端口号的

2021-05-25 11:14:44 296

原创 如何在kaggle上创建InClass竞赛

如何在kaggle上创建InClass竞赛最近在当本科生课程的助教,由于需要一个平台来评估学生在课程大作业中模型的指标,自然地就想到了kaggle,因为有不少的课堂竞赛是放在kaggle上面举办的,但是在网上查的如何创建竞赛的相关信息较少,在创建竞赛的过程中也踩了一些坑,所以在此记录一下。新建InClass竞赛在https://www.kaggle.com/competitions链接中,直接点击"Host a Competition",然后点击提示"Interested in hosting a c

2021-05-13 16:27:59 768

原创 多分类多标签模型的评估方式(定义+numpy代码实现)

一、Multi-Class Multi-Label问题定义所谓多分类(Multi-Class)是区别于二分类的一个概念,在二分类问题当中,数据的标签只是0,1二值类型,比如“是否”是一只狗,“是否”患病。而多分类则对应于更多的类别,比如判断物体是猫,狗,鸟,兔…判断病人患的是A,B,C,D中的某一种病。值得注意的是,多分类问题中常常只有一个类别是正确的。什么是多标签(Multi-Label)呢?简单来说,就是一个样本同时具有多个标签,例如一张风景图,里面有天空、猫、狗、鸟、树,如果这些类别都属于当前任务

2021-02-01 11:23:24 1860

原创 Linux服务器root权限下安装Anaconda3流程

Linux服务器在root权限下安装多用户Anaconda3流程在清华大学开源软件镜像站(https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/)下载最新版本Anaconda3wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.0-Linux-x86_64.sh)安装Anaconda3sudo bash Anaconda3-5.3.0-Linu

2020-10-23 21:37:04 1008

原创 numpy实现torch的topk方法

torch中提供了topk方法用来返回矩阵中对应维度中最大的K个元素以及在对应维度中的index,但是numpy并没有提供和torch一样的topk方法,所以在这里通过numpy的argpartition实现torch中的topk方法。直接给出代码:def topk(matrix, K, axis=1): if axis == 0: row_index = np.arange(matrix.shape[1 - axis]) topk_index = np.argpartition(-matri

2020-07-28 10:57:23 4422 3

原创 算法岗实习面经-字节跳动 PayPal 寒武纪 OPPO 平安科技等

本文记录2020年春季找算法实习的经历,主要是面试内容。文章目录PayPal Data ScientistOPPO研究院 计算机视觉算法字节跳动 推荐算法寒武纪科技 媒体算法平安科技 医学影像算法聚时科技 深度学习算法总结PayPal Data ScientistPayPal的DS实习面试轮数还是比较少的,分为一面、二面、HR面,Base上海。一面 (60min)1.自我介绍2.一道代码题(Easy难度),股票买卖问题,一个数组存储一支股票每天的价格,你只能买进一次,卖出一次,怎样收益最大?

2020-06-18 22:23:35 1492

原创 Pandas读取csv文件时多出一列数据方法解决

假设当前我有一个pandas.DataFrame格式的数据data需要存进csv文件中。先看看数据的格式然后保存至csv文件中data.to_csv('data.csv')查看文件内容head -n 2 data.csv------------------------------------------------,label_game_finish,u_age,u_face_score,u_gender,uhigh_value,u_mcd_avg,u_mdd_avg0,0.0,19.0

2020-06-12 12:38:16 5808 2

原创 毕业论文(word)生成指定格式目录方法

眼下快到毕业季,又到了大家疯狂写(shui)论文的时候了,如果是使用latex的大佬,大可不必为论文的格式而烦恼,但是还是有相当一大批同学是得用word写论文的,那么格式问题真是一个非常烦心的事情,总是这里有点问题那里有点问题,达不到论文的标准格式,特别是目录的生成,不同的学校设定的格式也不同,如何正确地生成给定格式的目录呢?本文将以哈工大本科毕业论文模板为标准,一步步完成指定格式目录的生成。这是目录的模板图(是手工打出来的2333),从模板中可以得出格式的要求:目录需要包括摘要、Abstra.

2020-05-15 11:57:33 8310

原创 PayPal Data Scientist实习面试经历

PayPal的DS实习面试轮数还是比较少的,分为一面、二面、HR面,Base上海。一面(60min):1.自我介绍2.一道代码题(Easy难度),股票买卖问题,一个数组存储一支股票每天的价格,你只能买进一次,卖出一次,怎样收益最大?3.数据库sql语句使用,给你一个S学生表(S_ID,S_NAME)、C课程表(C_ID,C_NAME)、SC学生选课成绩表(S_ID,C_ID,SCORE),...

2020-04-15 14:19:16 1581

原创 PyQt5 如何给QLabel设置边框颜色

在使用PyQt5制作GUI时,一般是通过QLabel控件来显示图片的,如果需要给图片设置边框的颜色应该怎么做呢?以下是解决方案:# 定义QLabeltemp_label = QtWidgets.QLabel()# 设置边框样式 可选样式有Box Panel等temp_label.setFrameShape(QtWidgets.QFrame.Box)# 设置阴影 只有加了这步才能设置边框...

2020-02-27 11:57:51 11208 2

原创 PyQt5将内存中图像数组转换QPixmap、QImage的方法

在PyQt5中,一般QPixmap、QImage通常都是直接从硬盘上读取图片获得,但是如果我想将torch.tensor类型转化成QPixmap在QLabel上显示应该怎么做呢?思路是可以将torch.tensor转为numpy,再将其转为PIL图像,最后利用toqpixmap() 和toqimage() 方法转为QPixmap和QImagefrom PIL import Imagei...

2020-02-26 22:19:07 6593

原创 清晰直观地理解LSTM的结构

从前,我对RNN的概念仅停留在它可以处理序列数据,进行机器翻译、文本生成、股票预测这些任务,但具体是怎么进行的,数据如何输入,具体的网络结构是什么,都不是很清晰。现在以LSTM为例,介绍我的理解过程。参考知乎的一个回答,LSTM的三种不同架构图及映射关系如下所示。上图图3中对应的6个输入实际上为1个长度为6的词向量,结合一个具体的例子来看,参考csdn的一篇博客 ,假设我们现在有这两句话:...

2020-02-14 20:29:39 477

原创 AutoAugment中16种数据增强方法可视化直观展示

在AutoAugment: Learning Augmentation Strategies from Data这篇论文中,作者提到使用强化学习的方式训练Controller RNN来学习良好的数据增强策略,文中提到16种数据增强的手段,为了具体形象地展示这些不同的数据增强方式,在这里把每一种方式对应不同幅值的效果画出,更加清晰直观。文章目录ShearXShearYTranslateXTrans...

2020-02-11 20:18:10 1761 1

转载 GPU没有进程运行,但是Volatile GPU-Util却很高,解决办法

输入nvidia-smi显示 GPU 3 没有进程在运行,但是Volatile GPU-Util达到了71%➜ compute-0-1: ~/> nvidia-smiMon Sep 26 14:48:00 2016 +----------------------------------------------------------------------...

2020-02-04 17:35:16 6136

原创 使用pycharm进行调试PyTorch项目时遇到"KeyboardInterrupt"程序终止

此类问题是由于在pycharm中开启了调试子线程的功能,在File->Settings->Building, Execution, Deployment->Python Debugger中,将Attach to subprocess automatically while debugging关闭即可。...

2020-02-01 20:33:53 7111 4

原创 使用PyTorch搭建神经网络进行肺炎病灶检测竞赛实战

文章目录1.肺炎病灶检测竞赛介绍2.数据集读取3.神经网络模型搭建4.训练5.测试6.结果与分析本文旨在实现一个简单而完整的竞赛过程,包括自定义数据集的读取、神经网络模型的搭建、训练、测试(提交竞赛结果)1.肺炎病灶检测竞赛介绍来源:link数据集规模:训练集20013张、测试集6671张数据尺寸:每张图片为1024x1024x3标签:取值范围[0,1,2,3,4],即每张图片对应的病...

2020-01-20 23:49:31 1780 7

翻译 机器学习/深度学习论文中常出现的Permutation Invariant解释

Permutation Invariant指的是特征之间没有空间位置关系,例如多层感知机,改变像素的位置对最后的结果没有影响f((x1,x2,x3))=f((x2,x1,x3))=f((x3,x2,x1))f((x1,x2,x3))=f((x2,x1,x3))=f((x3,x2,x1))f((x1,x2,x3))=f((x2,x1,x3))=f((x3,x2,x1))但是对卷积网络情况就不同了...

2019-12-11 21:31:38 10009 2

原创 论文阅读笔记:Momentum Contrast for Unsupervised Visual Representation Learning

Momentum Contrast for Unsupervised Visual Representation Learning论文地址期待代码开源Summary提出了Momentum Contrast(MoCo)的无监督视觉表示学习方法;把对比学习比作查字典过程,把字典当作队列,引入动量更新;对end-to-end、Memory Bank、MoCo三种对比学习方式进行了比较;在...

2019-11-29 15:17:17 6792 3

原创 论文阅读笔记:UNSUPERVISED DATA AUGMENTATION FOR CONSISTENCY TRAINING

UNSUPERVISED DATA AUGMENTATION FOR CONSISTENCY TRAININGgithub代码地址论文下载地址Summary将监督学习中常用的数据增强方式应用于半监督学习。在图像分类中应用RandAugment方法,文本分类中使用Back-translation和Word replacing with TF-IDF方法。提出TSA方法来处理有标签样本和...

2019-11-18 22:40:24 3897

原创 Anaconda虚拟环境使用jupyter notebook提示No module named tensorflow

在anaconda中创建虚拟环境,安装好tensorflow后,从虚拟环境中启动jupyter notebook后,发现import tensorflow as tf报错,提示No module named tensorflow,这是什么原因呢?实际上,你启动的是并不是虚拟环境中的jupyter notebook,而是外部的jupyter notebook,最好的解决方法是在你的虚拟环境中再次安...

2019-11-15 12:02:52 2139 2

原创 论文阅读笔记:Improving Generalization via Scalable Neighborhood Component Analysis

论文阅读笔记:Improving Generalization via Scalable Neighborhood Component Analysis论文地址代码地址Problem StatementParametric Softmax适用于带标签的大数据训练,而应用在开放式场景中(有新类别、样本少)是不可取的。Non-Paramertric embedding的各种方法有被用来处理...

2019-11-12 22:50:52 1002

原创 论文阅读笔记:Unsupervised Feature Learning via Non-Parametric Instance Discrimination

Unsupervised Feature Learning via Non-Parametric Instance Discrimination论文下载地址github代码地址Summary这篇论文主要论述如何通过非参数的实例判别进行无监督的特征学习。本文使用CNN backbone,原始图片输入网络后输出一个经过L2标准化的128维向量,通过Non-Parametric Softmax ...

2019-11-11 23:43:13 4856

原创 在python项目中调用Physionet上的WFDB算法包(c语言版)

需求如下:在python项目中集成wqrs、sqrs、gqrs、xqrs等QRS波检测算法,对MIT心律不齐数据库中的数据进行检测,得到QRS波位置并与R波真实位置进行可视化比较,在这里记录一下我自己的做法。1.首先是到Physionet官网上下载WFDB算法包,它是用C语言编写的(xqrs和gqrs有对应的python版wfdb算法包,可以直接调用),如果在windows下运行它的一些算法,...

2019-11-01 22:07:07 1644

原创 Pycharm中引用本地文件py失败,显示红色波浪线,运行时提示ModuleNotFoundError: No module named 'XXXX'解决办法

在pycharm项目中,我自己定义了一些函数放在algorithm_integration.py文件,在同一文件夹下的另一views.py文件中使用from algorithm_integration import *时显示下划红色波浪线,在运行的时候提示ModuleNotFoundError。上面是我的项目目录树和显示波浪线问题,网上查了资料后,应该进行如下操作:1.在Setting...

2019-10-13 16:15:39 1726

原创 PAT树的深度优先搜索(dfs)和广度优先搜索(bfs)

dfs和bfs都是常用的搜索算法,结合PAT1094,简单动手分别以dfs和bfs实现树的遍历吧。1094The Largest Generation(25分)A family hierarchy is usually presented by a pedigree tree where all the nodes on the same level belong to the sa...

2019-09-01 11:30:35 279

原创 PAT已知二叉树前序遍历和中序遍历,求后序遍历序列

PAT甲级1086题Tree Traversals Again,类似的是1020题Tree Traversals,只不过1020题意更直白(直接告知后序和中序遍历序列,求前序遍历序列)。1086. Tree Traversals Again (25)时间限制200 ms内存限制65536 kB代码长度限制16000 BAn inorder binary tree traver...

2019-08-30 13:46:23 688

原创 PAT最短路径问题简单总结

在PAT甲级真题目录中,涉及到最短路经问题求解的有1003、1018、1030、1087、1111。一般来说,可以用最短路径算法(dijkstra、SPFA等)加上DFS进行求解。我一般用这些数据结构:struct node{ int v;//与该地点相连的地点的序号 int cost;//两个地点之间的距离 //...由题意确定需要增加变量 node...

2019-08-28 16:53:44 376

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除