自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 问答 (1)
  • 收藏
  • 关注

原创 深度学习面试每日一题

1、反卷积(deconvolution) 反卷积的用途:实现上采样,近似重构输入图像,卷积层可视化。 反卷积也称为转置卷积,如果用矩阵乘法实现卷积操作,将卷积核平铺为矩阵,则转置卷积在正向计算时左乘这个矩阵的转置,在反向传播时左乘W,这与卷积操作刚好相反,需要注意的是,反卷积不是卷积的逆运算。 卷积:,反卷积:。 ...

2020-09-08 15:02:49 11966

原创 docker的编译,运行

编译filename.Dockerfile,生成镜像文件docker build -f filename.Dockerfile -t repository:tag .使用镜像文件生成docker contanierdocker run -it --gpus all --privileged=true --userns=host --shm-size=8g --name mydocker -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -v out_di

2022-02-18 09:39:08 1008

原创 Python添加清华源和豆瓣源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/cond.

2022-02-18 09:21:43 2525

原创 烟火检测论文阅读

1 Wildland Forest Fire Smoke Detection Based on Faster R-CNN using Synthetic Smoke Imgaes

2021-06-08 22:35:29 441 5

原创 后端开发面试每日一题

GOGOGO

2021-05-22 10:23:53 171

原创 360计算机视觉实习生二面(2021-5-11)

牛客网视频面试,约50min。1. 自我介绍。2. 围绕我在cmu的项目细问(比如哪些模型是自己训练的,哪些用的预训练的模型,怎么做的不同模型间的融合,检测模型用的哪些等等)。3. 针对交通高速公路这个项目细问(比如超速检测怎么测试,怎么做的追踪等等)。4. yolo系列和rcnn系列的特点和区别。5. 编程题:请从一个数组中取出不连续的任意个数,使其和最大,并输出该值。例如,[2,-3,3,50],输出52。6. 我问公司在视觉算法方面有哪些业务项目:检测审核违规事件;嵌入式设备上

2021-05-12 11:06:07 138

原创 腾讯(微信产品)C++后台开发实习生一面(2021-4-29)

牛客网视频面试,约30分钟。1. 自我介绍。2. 问我参与度最高的项目,让我说项目流程。3. 问我平时C++主要用在那些地方,然后用的是C++11还是98。4. 问了我一些基础:C++的虚表(包括怎么寻址),容器(包括map的底层存储结构,红黑树只是数据实现结构),用过网络编程没有?HTTP2.0相对HTTP有哪些不同,HTTPs相对HTTP有哪些不同,以及HTTPs怎么进行加密的。5.做编程题:第一题是排序含有很多个0,1,2的数组(我用的快排,问我有没有O(n)的方法,暂时没想到);

2021-04-29 17:47:51 125

原创 360计算机视觉实习生一面(2021-4-29)

牛客网视频面试,约30分钟。1. 自我介绍。2. 问项目,cmu的实习项目,我遇到的问题,我的主要工作。3. 问参加的抽烟打电话比赛细节。4. 做编程题:n个数求最大的m个数,我说先排序,再返回k个数,然后就让我写了个快排。5. 我问他们CV这方面的业务(主要做图像检索,特征匹配)。...

2021-04-29 17:40:02 100

原创 阿里(达摩院)计算机视觉实习生二面(2021-4-28)

电话面试,约20分钟。1. 数学问题:均匀分布怎么转为正态分布,线性代数的SVD。均匀分布怎么转为正态分布:The Box–Muller transform,The Ziggurat algorithm(金字形神塔)。 SVD:奇异值分解(多用于数据降维) 特征值分解定义(EVD),如果矩阵A是一个m*m的实对称矩阵(即A=A^T),那么它可以被分解成如下的形式A=QΣQ',其中Q为标准正交阵,即有QQ'=E,Σ为对角矩阵,且这些矩阵的维度均为m*m。Σ的对角元素为特征值,Q为特征向量。 奇

2021-04-29 11:58:50 565 3

原创 《Spatially-Adaptive Filter Units for Compact and Efficient Deep Neural Networks》阅读笔记

待解决的问题:CNN在计算机视觉任务上表现非常好。有效的感受野大小是CNN最关键的框架元素之一,不过它必须手动设置去适应特定的任务。标准的解决方法包括大的卷积核,下/上采样和扩展卷积。而这些都需要测试不同的扩展率和下/上采样因子,这会导致生成不紧凑的表征和过多的参数。 解决思路:本文提出一个由displaced aggregation units(DAU)组成的卷积滤波器。DAUs学习空间位移,并使单个卷积滤波器适应给定的问题,因此消除了手工修改的必要。实验证明,在AlexNet,ResNet50,Res

2021-04-26 20:41:19 201

原创 阿里(达摩院)计算机视觉实习生一面(2021-4-26)

电话面试,约40分钟。1. 自我介绍。2. 细聊cmu的实习和参与的项目,细节问的特别清,非常关注哪些是我做的,效果怎么样。这个项目可能都聊了20多分钟。3. 问我的GPA,然后在校上过那些这方面的课程,比如深度学习,机器学习之类的。然后我说上过计算机视觉,又问我熟悉图像分割吗,知道哪些图像分割方法。4. 继续问我现在的目标检测分为那几派,各有什么特点。5. 问L1范数和L2范数的概念和应用场景。6.接着我问他们部门主要做什么,怎么培训新人,我如果有机会去做什么。...

2021-04-26 15:32:11 321

原创 美团(美团酒店)后台开发实习生HR面试(2021-4-20)

电话面试,约20分钟。1. 问高考成绩,考研成绩,本科和研究生阶段的成绩和获奖情况。2. 细问我参加的抽烟打电话识别竞赛我负责的模块,队伍平时怎么讨论。3. 问我是否转语言开发(因为我是C++,他们主要做的是JAVA),然后问工作地点在北京是否可以接收。4. 我问他们怎么培训新人,转正情况,以及工作环境。...

2021-04-22 13:40:14 179

原创 美团(美团酒店)后台开发实习生二面(2021-4-15)

牛客网视频面试,约30分钟。1. 自我介绍。2. 让我介绍我最出色的一个项目,然后针对性问了一些问题,比如遇到的难点,怎么解决之类的。3. 然后做了两道编程题,一道滑动窗口题(最开始理解错了用dfs去做,后来问清楚题意后做对),另一道是随机红包算法。4.我问他们培训机制和学习机制,总共几面(两面),以及我为了胜任这个工作还有哪些地方需要提升(说我学的不深,需要学深一点,因为他们是JAVA后台开发)。...

2021-04-19 19:20:20 144

原创 美团(美团酒店)后台开发实习生一面(2021-4-13)

牛客网视频面试,约50分钟。我投的是计算机视觉实习生,3月19号做的笔试(4道编程题+3道多选题),然后4月6号给我发邮件,说我投的岗位投录比是15:1,让我重新选择一个意向的岗位,然后我选择了后台开发。4月12号通知我面试。1. 问我有没有意愿转JAVA,因为他们C++岗位很少,基本后台都是JAVA。2. 问我平时是怎么学习的C++。3. 问我面向对象和面向过程的区别。4. 问我继承,封装,多态的概念,适合用在哪些场景,JAVA和C++在继承方面有什么区别。C++怎么实现继承,封装和多态。

2021-04-13 16:46:08 141

原创 腾讯(腾讯视频)C++后台开发实习生二面(2021-4-7)

面试方式:腾讯面呗视频面试,约50分钟。1. 首先自我介绍。2. 首先让我介绍TCP的四次挥手过程,问如果最后一个ACK没有收到会怎么样?问什么是四次而不是两次?四次挥手完马上就会变成Closed状态吗?3. 让我介绍我对进程,线程和协程的理解。然后问我进程的底层实现方式,是否接触过协程。4. 问IPC的通信方式有哪几种?我说了后问我半双工和全双工有什么区别?又问共享内存是怎么实现的?5. 让我用网络编程实现一个TCP连接,我说我不会,没接触过网络编程。6. 问我平衡二叉树的性质,和

2021-04-08 15:38:11 858

原创 阿里达摩院计算机视觉算法工程师初试(2021-4-2)

电话面试,30多分钟,本次面试主要是面试我的意愿,基础能力,解决问题的能力。如果面试完觉得我不错的话会帮我推到阿里达摩院面试系统里面进行正式的面试流程。1. 首先是自我介绍,项目经历,实习经历,毕业的一些想法。问题:问烟火检测怎么降低误报率(容易把红色的目标误检成火)。(因为我的简历上面我写了我做过烟火检测) 回答:针对烟火数据难以收集的问题,尤其是小烟和小火,可以考虑使用GAN网络来生成一些烟火数据,然后针对烟火的误报,可以利用烟火的一些动态特征来减少误报。问题:问我上面这个思路有做个实.

2021-04-03 17:48:27 375 1

原创 腾讯(腾讯视频)C++后台开发实习生一面(2021-4-1)

1. 让我介绍我参与的多媒体事件提取系统项目,问我发过paper没有。2. 问我对C++和Python的掌握程度,什么时候开始学的,C++使用的多不多。3. 根据第一次的笔试设计题(在线手机通讯录),问了一些数据库表的设计, 系统的拓展性(如果一个服务器存储不下数据,怎么用多台服务器存储)。4. 问一些基础,如死锁;数据库的一致性;平衡二叉树,红黑树和B+数的区别;STL中常用的容器及其区别;设计模式;网络编程;数据库的隔离性。(后面三个都没回答上来)5. 出了一道求最大次数的编程题,我用哈

2021-04-01 15:31:37 211

原创 Pytorch之Hook

Hook是Pytorch中一个十分有用的特性。利用它,我们可以不必改变网络输入输出的结构,方便地获取、改变网络中间层变量的值和梯度。这个功能被广泛用于可视化神经网络中间层的feature、gradient,从而诊断神经网络中可能出现的问题,分析网络有效性。Pytorch中Hook的用法:Hook for Tensors:针对Tensor的hook。 Hook for Modules:针对例如nn.Conv2d nn.Linear等网络模块的hook。 Guided Backpropagatio.

2020-11-05 16:49:36 166

原创 KD-Tree的创建

KD-Tree(也称为K维树)是一种二叉搜索树,其中每个节点中的数据是空间中的K维点。 简而言之,它是用于组织K维空间中的点的空间划分的数据结构。KD-Tree中的非叶节点将空间分为两部分,称为半空间。该空间左侧的点由该节点的左侧子树表示,空间右侧的点由右侧子树表示。根将具有x对齐的平面,根的子代都将具有y对齐的平面,根的孙子都将具有x对齐的平面,而根的曾孙将具有y对齐的平面,依此类推。概括:让我们将平面编号为0、1、2…(K – 1)。 很明显,深度D处的点(节点)具有A对齐的平面,其中A的计算.

2020-10-21 11:31:57 557

原创 记录非root权限安装caffe

在本教程中,我将介绍如何在没有root特权的情况下安装Caffe。 我假设你已经安装了Anaconda和CUDA。创造虚拟环境conda create -n caffeconda activate caffe安装依赖conda install boost openblas mkl mkl-include gflags glog lmdb leveldb h5py hdf5 scikit-imageconda install ffmpegconda install -c menpo.

2020-10-15 22:07:15 351 1

原创 Hierarchical softmax

softmaxSoftmax(归一化指数函数)是输出层函数,它激活我们每个节点作为神经网络计算的最后一步。 它用于计算至少2种不同类型的常见word embedding:word2vec和FastText。 此外,它是神经网络结构的许多情况下的激活步骤,以及sigmoid和tanh函数。 softmax的定义是:其中,激活输出向量的每个元素都是单词在给定输入单词I的词汇表中等于第j个单词的概率。 此外,值得一提的是,输出向量的元素之和等于1,并且它的每个元素都映射到一个范围[0,1]中。这种

2020-10-11 09:46:02 313

原创 《Distributed Representations of Words and Phrases and their Compositionality》阅读笔记

本文提出了原始Skip-gram model的几个扩展。本文展示了在训练过程中通过对频词的次采样会导致显著的加速(大约2x-10x),同时也会提升小部分频词表征的准确率。另外,本文提出一个简化的多样性NCE(Noise Contrastive Estimation)去训练Skip-gram模型,这比之前工作中使用的更复杂的分层softmax有着更快的训练和更好的表示频词。...

2020-10-10 20:33:01 76

原创 Word Embedding,Word2Vec和Glove讲解

Word Embedding是什么?人类一直擅长理解语言。 人类很容易理解单词之间的关系,但对于计算机来说,这项任务可能不简单。 例如,我们人类理解国王和王后,男人和女人,老虎和老虎之间有某种类型的关系,但计算机怎么能弄清楚这一点呢?word embedding基本上是一种词表示形式,它将人类对语言的理解与机器的理解联系起来。 他们已经学习了文本在n维空间中的表示,其中具有相同含义的单词具有相似的表示。 这意味着两个相似的词由几乎相似的向量表示,它们非常紧密地放置在向量空间中。 这些对于解决大多数自

2020-10-09 15:57:32 1209 1

原创 《Detect-to-Retrieve: Efficient Regional Aggregation for Image Search》阅读笔记

图像检索系统现在主要遇到两个问题:过滤,这是一种根据数据库图像与查询图像的相似性对数据库图像进行排序的有效技术。

2020-10-09 14:57:52 560

原创 图解word2vec

Word2vec是一种有效创建单词嵌入的方法,自2013年以来一直存在。但是,除了其作为词嵌入方法的效用之外,它的某些概念甚至在商业性非语言任务中也被证明可以有效地创建推荐引擎并理解顺序数据。像Airbnb,阿里巴巴,Spotify和Anghami这样的公司都受益于从NLP领域中雕刻出这台出色的机器并将其用于生产中,从而为新型推荐引擎提供支持。在本文中,我将介绍嵌入(embeddings)的概念以及使用word2vec生成嵌入的机制。 但是,让我们从一个示例开始,以熟悉如何使用向量来表示事物。 您是否知

2020-10-08 14:12:54 203 2

原创 Large-scale image retrieval with attentive deep local features(DELF)阅读笔记

本文提出了一种专门为大规模图像检索应用程序设计的局部特征descriptor,即DELF。 DLEF是在弱监督下学习的,仅仅使用图像级标签,并结合用于语义特征选择的注意力机制。注意力机制是用来关键点选择,与descriptor共享网络层。 为了适当评估大规模图像检索算法的性能,引入了Google Landmarks数据集(包含1M以上的数据库图像)。 使用DELF进行图片检索主要有四步: 提取密集的局部特征(by FCN,ResNet50作为baseline) ..

2020-09-29 10:12:34 764

原创 python批量png转jpg

只需要修改png的文件夹地址和转换后jpg的保存地址即可使用。# png -> jpgfrom PIL import Imageimport cv2 as cvimport os def PNG_JPG(png_path, jpg_path): img = cv.imread(png_path, 0) w, h = img.shape[::-1] img = Image.open(png_path) img = img.resize((int(w / 2

2020-09-23 10:43:13 332

原创 Machine Learning -- 李宏毅 -- 2020 -- Regression

Regression可以做什么股票预测 无人驾驶 商品推荐

2020-09-21 17:02:19 69

原创 Machine Learning -- 李宏毅 -- 2020 -- P1

机器学习就是自动找函数。你想找什么样的函数regression:函数的输出是一个数值 二值分类: 多分类: Generation(生成):产生有结构的复杂东西,例如句子,图片怎么告诉机器你想找什么样的函数supervised learning:需要labeled data,给定一个loss函数,接下来机器会自动找出loss最低的函数。 reinforcement learning: unsupervised learning:给data但是不标注机器怎么找出你想要的函数给的函.

2020-09-21 15:53:10 88

原创 mmdetection使用预训练模型fine-tune

在https://github.com/open-mmlab/mmdetection下载预训练模型,如我这里使用的是cascade_rcnn_r50_fpn_1x_coco。import torchnum_classes = 4model_coco = torch.load("./checkpoints/cascade_rcnn_r50_fpn_1x_coco_20200316-3dc56deb.pth")# for key, value in model_coco["state_dict"]

2020-09-20 20:45:20 7946 1

原创 PyTorch常用知识点

torch.cattorch.cat是将两个张量(tensor)拼接在一起。 使用torch.cat((A,B),dim)时,除拼接维数dim数值可不同外其余维数数值需相同,方能对齐。 >>> import torch>>> A=torch.ones(2,3) #2x3的张量(矩阵) >>> Atensor([[ 1., 1., 1.], [

2020-09-13 14:24:09 196

原创 计算机视觉----attention

Attention Mechanism主要有以下两个方面作用:决定需要关注输入的哪部分。 分配有限的信息处理资源给重要的部分。在神经网络中,注意力模块通常是一个额外的神经网络,能够硬性选择输入的某些部分,或者给输入的不同部分分配不同的权重。关于模型优化,注意力机制通常有一个连接在原神经网络之后的额外的神经网络实现,整个模型仍然是端到端的,因此注意力模块能够和原模型一起同步训练。对于soft attention,注意力模块对其输入是可微的,所以整个模型仍可用梯度方法来优化。而对于hard attent

2020-09-12 23:05:35 135

原创 深度学习工具之Sacred

介绍Sacred是一个能够帮助你配置,组织,记录和重现实验的工具。它旨在完成我们需要围绕实际实验进行的所有繁琐的日常工作,以便: 持续跟进我们实验的所有参数 简单的进行不同设置的实验 将单次运行的实验配置信息保存到数据库中 重现我们的结果 Sacred实现这些通过下面的机制: ConfigScopes:函数中局部变量定义实验所用参数的一种非常方便的方法。 Config Injection:可以从每个函数访问我们配置的所有参数。 它们会按名称自动注入

2020-09-08 15:55:19 1670

原创 记录FsDet安装心酸过程

server环境:gcc:7.5.0,cuda:10.2,nvcc:10.2.89,pytorch:1.5.0根据FsDet的README.md逐步安装需要的依赖文件,一些正常安装。但是在最后一步build FsDet时,使用python setup.py build develop时一直报着下面的错误:通过网上一翻搜索和中间尝试过不断变化server环境:如gcc降为7.1.0,仍然报错;cuda降为10.1,nvcc降为10.1.105,仍然报错;最后将pytorch降为1.4.

2020-09-03 19:13:32 1064 10

转载 非root用户在linux下CUDA和cuDNN

非root用户在linux下安装多个版本的CUDA和cuDNN(cuda 8、cuda 10.1 等)

2020-09-03 17:35:25 160

原创 非root用户离线安装gcc7.1.0

网上使用root权限安装gcc的资料很多,但是非root用户离线安装gcc的却很少,另外在编译安装中也遇到了很多问题,在这里记录下安装过程,同时报错的解决办法。环境:ubuntu 18.04, 默认装的gcc为7.5.0安装步骤:选择要安装的gcc版本,我准备装的是7.1.0,然后在https://ftp.mirrorservice.org/sites/sourceware.org/pub/gcc/releases/下载对应的gcc版本,我这里下载的是gcc-7.1.0.tar.gz。 下载到

2020-09-03 11:10:04 1450

原创 记录前端开发种遇到的一些问题

1.node怎么获取到文件根目录node当中有个全局变量__dirname ,可通过path引用获得项目根目录var path = require('path');var root = path.join(__dirname, '../../');

2020-04-16 00:24:40 85

原创 机器学习(周志华)第一章作业

1.1数据集1,4共有三种属性,每个属性共有2种取值,则可知共有3*3*3+1=28种假设。设A=色泽,B=根蒂,C=敲声;X=青绿,Y=蜷缩,Z=浊响则版本空间为:A=X, B=Y, C=*;A=X, B=*, C=Z;A=*, B=Y, C=Z;A=X, B=*, C=*;A=*, B=Y, C=*;A=*, B=*, C=Z;A=*, B=*, C=*...

2020-04-15 23:32:56 165

原创 React中img引入图片的两种方式

react src里面引入图片的几种方式es6不支持在<img />标签内直接写图片的路径,即<img src="../images/photo.png"/>(1)import方法import imgURL from './../images/photo.png';<img src={imgURL } />(2)require方法 这种方法需要注...

2020-04-13 08:36:43 533

原创 人工智能入门必备

人工智能基础:机器学习语言:Python库:numpy, pandas, matplotlib,scikit-learn, tensorflow机器学习的基础:算法,数据,程序,评估,应用学习机器学习需要注意数学原理推导,实际应用技巧等等,推导尤为重要。深度学习是机器学习的一部分。第一次写博客,真不知道写啥。以后学习人工智能再慢慢写吧。

2017-12-30 20:20:25 265

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除