虎妞C-CSDN博客

原创记录deecamp2018之旅

叨叨念：我刚刚经历了秋招找工作算法红海的厮杀，终于能静下来，回顾和感谢deecamp给我的一切。 DeeCamp 官方介绍：DeeCamp是全球规模最大的高校AI人才国际培养计划的一部分。主办方：教育部国际交流与合作司、中外人文交流中心，北京大学，创新工场人工智能工程院DeeCamp吸引了全球600多高校，7000多学生角逐300个培训名额，录取难度超过哈佛顶尖名校。在5周的时...

2018-09-18 12:53:19 3191 1

原创 IDT + FisherVector （by C++）我的实践

准备写一系列总结, 总结过去一年，我在 Video Action Recognition 方向跑过的实验，写过（改过）的程序,算是对在新加坡这一年的交代。不悔梦归处，只恨太匆匆。以下代码在我的github:https://github.com/HuNiuC/iDT-FV-for-action-recognitonIDT + FisherVector编码1. IDT 特征提取IDT 的官方代码在这里...

2018-06-11 14:30:54 2048 20

原创使用TensorFlow训练模型的姿势

又名TensorFlow踩坑记模型终于run起来，但是还是有问题，这几天我的状态：打开三个终端，一个输入Top 看内存占用：10.6%还算正常，毕竟前几天我是经常50%以上爆内存的人...一个终端输入：watch -n 2 nvidia-smi 看GPU使用情况 :我使用的是第三个GPU，占了9G,GPU利用率100%也正常一个终端实时观察模型输出：不到一个epoch，目前Loss没有明显下降，...

2018-04-21 22:26:14 1030

原创用python实现one-hot编码

失败不可怕，怕的是偶然的成功。码代码跑实验谈恋爱找工作莫不如此。之前用TensorFlow 跑了I3D的模型，很顺利。Loss完美下降，视频数据读入也没遇到大问题。偶然的成功，让我以为tensorflow So-easy嘛。现在自己想做点东西，才发现有些坑你没遇到是因为你做的太少太简单Too young, Too simple.tensorflow 封装的函数tf.one_hot():impor...

2018-04-19 16:46:44 2389 1

原创 CVPR2018：腾讯AI LAB 基于大间隔余弦损失的人脸识别

今天的深度学习，最牛的大佬们在改结构，比如Hinton,何凯明很牛的大佬在改损失函数，比如这篇《CosFace: Large Margin Cosine Loss for Deep Face Recognition》牛的大佬在现有的算法上提出层出不穷的新应用而我，在当分母～文章主要创新点就是对人脸识别的损失函数做了优化。首先复习点余弦距离：1、余弦距离余弦距离，也称为余弦相似度，是用向量空间中两个...

2018-04-11 11:46:35 5495

原创创新工厂地狱５０题

创新工厂在组建一个人工智能的社区，据说完成３道并且通过专家评审，即可获得新社区邀请资格。专家有李开复，Hinton...以下是我的回答和50道问题。有时间的话一定要把这50道题答一遍，这是一个精选笔试面试集合：）我的回答：7. 深度神经网络（deep neural network）具体工作原理是怎样的？深度神经网络是多重非线性变换构成的多个处理层对数据进行高层抽象的算法，或者说是通过复合多层次线...

2018-03-30 11:58:49 694 1

原创写在三月末尾

金三银四。跳槽是，实习亦然。站在3月的末尾，我想写点东西。我觉得自己的找实习经历，跟罗振宇的一个比喻很像。最开始的时候，妈妈给我的两个衣服口袋里装满了大枣，我觉得枣很多，有的看着小，有的咬一口觉得不好，就把它们随手扔在地上。慢慢的，我发现口袋里的枣越来越少。我开始细嚼慢咽，不敢轻易浪费。到了最后，口袋里的枣没有了，我只能把地上扔着的，又重新捡了起来，而且比之前还要小心翼翼。跟我哥聊天，说起现在的境...

2018-03-28 13:43:23 296 3

原创 YouTube推荐算法

推荐系统架构，候选集生成，排序1. 推荐算法框架millions原始数据 -》用户历史信息和上下文信息-》候选集生成-》hunderds 数据-》排序（1）首先关注图片中下几个单词millions、hundreds、dozens：表示数据量的级别，全部的video corpus大概是millions级别，经过candidate generation之后大概是hundreds级别，经过ranking...

2018-03-17 16:44:48 1863 2

转载美团推荐算法实践

从框架的角度看，推荐系统基本可以分为数据层、触发层、融合过滤层和排序层。数据层包括数据生成和数据存储，主要是利用各种数据处理工具对原始日志进行清洗，处理成格式化的数据，落地到不同类型的存储系统中，供下游的算法和模型使用。候选集触发层主要是从用户的历史行为、实时行为、地理位置等角度利用各种触发策略产生推荐的候选集。候选集融合和过滤层有两个功能，一是对出发层产生的不同候选集进行融合，提高推荐策略的覆盖...

2018-03-17 16:36:50 515

转载 FisherVector编码

BoVBOV解决的是提取SIFT特征之后，特征数据量太多而无法快速计算相似度的问题。如果是用聚类算法对这些SIFT特征矢量数据进行聚类，然后用聚类中的一个簇代表BOV中的一个视觉词，将同一幅图像的SIFT矢量映射到视觉词序列生成码本，这样每一幅图像只用一个码本矢量来描述，这样计算相似度时效率就大大提高了。具体来说BoV特征编码主要是下面的步骤：对训练集中的M副图像进行预处理并提取SIFT特征，假设...

2018-03-17 16:20:58 2472

转载今日头条推荐算法研究

算法分发是信息平台，搜索引擎，浏览器，社交软件等几乎所有软件的标配。系统推荐系统的本质上要解决用户环境和资讯的匹配 y = F (Xi, Xu,Xc)推荐系统，如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数，这个函数需要输入三个维度的变量。第一个维度是内容。头条现在已经是一个综合内容平台，图文、视频、UGC小视频、问答、微头条，每种内容有很多自己的特征，需要考虑怎样提取不同内容类...

2018-03-17 16:17:02 2720

转载深度学习在58同城智能推荐系统中的应用实践

FM模型能够解决大规模稀疏数据下的特征组合问题，FM模型公式如下图所示，公式前半部分其实就是LR（Logistic Regression），后半部分是两两特征的交叉形式（以二阶形式为例）。例如特征Xi和Xj的交叉后变成一个新特征，特征值为Xi*Xj，特征权重为Wij，这里的Wij又可以表示为两个K维向量Vi和Vj的乘积，FM模型在训练过程中能够自动学习出向量Vi和Vj，向量Vi称之为特征Xi的隐向...

2018-03-17 16:07:58 938

转载 58同城智能推荐系统的演进与实践

首先看一下58同城推荐系统整体架构，一共分数据层、策略层和应用层三层，基于58平台产生的各类业务数据和用户积累的丰富的行为数据，我们采用各类策略对数据进行挖掘分析，最终将结果应用于各类推荐场景。数据层：主要包括业务数据和用户行为日志数据。业务数据主要包含用户数据和帖子数据，用户数据即58平台上注册用户的基础数据，这里包括C端用户和企业用户的信息，帖子数据即用户在58平台上发布的帖子的基础属性数...

2018-03-17 14:39:33 1634

原创姿态估计 RMPE: Regional Multi-Person Pose Estimation 论文学习

小白一只，正在学习论文RMPE: Regional Multi-Person Pose Estimation[1][1] Fang H, Xie S, Lu C. Rmpe: Regional multi-person pose estimation[J]. arXiv preprint, 2017.现阶段常用的姿态识别方法，包括两步(two-step framework) 框架和基于部分(...

2018-02-06 15:19:43 2108 12

转载图像识别中的深度学习

深度学习发展历史深度学习是近十年来人工智能领域取得的重要突破。它在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域的应用取得了巨大成功。现有的深度学习模型属于神经网络。神经网络的起源可追溯到20世纪40年代，曾经在八九十年代流行。神经网络试图通过模拟大脑认知的机理解决各种机器学习问题。1986年，鲁梅尔哈特(Rumelhart)、欣顿(Hinton)和威廉姆斯(Williams...

2017-08-25 09:44:56 1722

原创不配置OpenCV环境，以动态链接的方式使用OpenCV

很多时候我们并不想配置OpenCV环境（可能是由于条件不允许，比如没有服务器的root权限，或者已经配置了不同版本的OpenCV）我们只需要动态链接的方式使用openCV.上一篇博客提到了我要用一个依赖Cuda版本编译的Opencv2.4.9的C++ 程序（GPU提取视频光流特征）。程序中原来的CMakeLists.txt 是这样链接到OpenCV 的：# OpenCV Configfind_pa...

2017-08-22 20:32:44 3691

原创 Ubuntu 非root 权限（普通用户）安装OpenCV 2.4.9

实验室GPU服务器一般使用者是没有Root权限的，也就是只是普通用户权限。我们实验室服务器安装的Opencv都是最新的OpenCV 3.2版本，而我要跑的程序（GPU提取视频光流特征）是依赖于Cuda版本的OpenCV2.4。因此我需要在我的目录下安装OpenCV2.4 版本。经过查看，服务器已经安装了Cuda 8.0. GPU 为NVIDIA的TiTan.以下是我的安装过程1. 首先...

2017-08-22 19:28:15 3250 2

原创 Cross-view Action Recognition 跨视角动作识别方法

Cross-view action recognition 训练集动作是在一个视角下观察的,而测试集是在不同的视角下,因此由于不同动作在不同视角下的类内差异比同一视角下的类间差异大，因此Cross-View动作识别是比较有挑战性的研究方向。目前解决这一问题的方法，传统方法主要有以下几种：通过3D重建( 3D reconstruction)，建立不依赖视角的人体3D模型。寻找对视角变化不敏感的动作特...

2017-08-18 11:02:17 3575

原创 Ubuntu 安装ＱＴ５后编译程序报错： FindQt5Widgets.cmake

安装ＱＴ５．４后，需要编译一个Ｃ＋＋程序。　Cmakelist 有find_package(Qt5Widgets REQUIRED)，cmake　报错如下：CMake Error at CMakeLists.txt:14 (find_package): By not providing "FindQt5Widgets.cmake" in CMAKE_MODULE_PATH this projec...

2017-08-12 21:33:39 9070

原创 FisherVector编码的来龙去脉

最近在研究动作识别（Action Recognize）领域的论文和方法。在视频动作识别领域，深度学习未进入前，传统方法最好的是iDT. IDT采用FisherVector编码的方式比ＢＯＦ（Bog of Features）提升了２％－１０％．ＢＯＦ的编码方式，最终的视频特征维度是CodeBook的size大小。原理如图：）丑到不忍直视...FiserVector编码方式，由两部分组成首先是由样本分...

2017-08-09 12:00:35 4966 3

原创动作识别：improved dense trajectories（iDT）特征编码—Fisher Vector代码学习

论文”Action Recognition with Improved Trajectories”通过相机运动估计，使得提取的光流更加准确，以及ＦｉｓｈｅｒVector 编码，提升了Dense Trajectories的效果。iDT的代码可以点击此处下载，对iDT特征进行FV编码的代码可以在dtfv 下载。iDT代码的解析可以参考这篇论文　http://blog.csdn.net/wzmsltw/...

2017-08-07 21:29:48 4085

原创论文学习-双低秩分解

通过双低秩分解的鲁棒的多视角子空间学习算法Ding Z, Fu Y. Robust Multi-view Subspace Learning through dual low-rank decompositions[C]//Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence. AAAI Press, 201...

2017-02-13 21:05:56 714

原创张量分解论文学习

近期学习了一篇2017年新出炉的发表在Digital Signal Processing 上的论文《Second-order optimization based adaptive PARAFAC decomposition of three-way tensors 》论文研究对象为三阶张量，其中一个维度随着时间线性变化。该算法是基于牛顿方法优化的交替最小二乘算法。通过保持Khatri–Rao

2017-02-10 10:28:46 3045

转载机器学习算法基础--矩阵

线性代数课程，无论你从行列式入手还是直接从矩阵入手，从一开始就充斥着莫名其妙。比如说，在全国一般工科院系教学中应用最广泛的同济线性代数教材（现在到了第四版），一上来就介绍逆序数这个“前无古人，后无来者”的古怪概念，然后用逆序数给出行列式的一个极不直观的定义，接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上，再把那一列减过来，折腾得那叫一个热闹，可就是压根看不出这个东西有嘛用。大...

2017-02-09 20:12:51 1337

翻译微分几何、黎曼几何思想

微分几何、黎曼几何思想（1）物理规律与坐标选取无关尽管任何有用的实际计算都是在某个坐标系下进行的，但计算结果表达的物理规律却是独立于坐标系而存在的。这也是为什么要将描述的物理规律的方式式写成‘张量’形式的原因。因为张量的坐标分量在坐标变换下做线性其齐次变换。线性表明张量属于切空间，其次表明张量与坐标系选择无关。（2）内蕴的思想。微分几何所有概念和结论都是内蕴的。就是说他们只和这个流形有关，和流形...

2016-12-14 09:57:31 4169

原创张量基本知识

为什么引入张量：与坐标系无关的数据分析方法。张量分析的发展：1915年爱因斯坦在相对论中的应用而广泛受到关注。广义相对论就是完全用张量的语言描述的。张量的最简单理解：数据的多路排列（两个下标以上的数据表现形式）。属于多重线性数据分析。黎曼几何：黎曼把高斯的非欧几里得几何与凯莱等的n维线性空间理论综合起来，提出了n维晚去空间的概念，并按照微分几何学的思路，认为只要构造出空间的度量形式，就可以确定空间...

2016-12-10 12:30:44 6108

原创图像修复常用方法

有关曲线、区域和三维表面等特征的提取的研究工作分为正则化方法，松弛标记法，鲁棒性方法，水平集方法，聚类方法，基于结构显著性的方法，基于视觉竞争合作机制的组织方法和用于图像修复的一些方法等。

2016-12-10 11:52:42 5982

原创 Pandas data_range函数

最近在做一个大数据电力分析项目。在github下载了Python源代码。数据结构是Pandas 中的dataframe 所以想系统的学习Pandas 工具包。首先需要产生时间序列data_range.函数原型pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=Fal

2016-09-24 19:52:56 10150 1

shanyicheng1111的博客