自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 资源 (1)
  • 收藏
  • 关注

原创 为什么GBDT需要使用损失函数的负梯度去拟合一个新的回归树?

GBDT

2022-02-24 21:58:29 637

原创 Ubuntu下detectron2 的安装使用笔记

安装使用了一波detectron2 ,感觉没有mmdetection好用…但是还是记一下安装和使用的过程安装确保你的python版本是3.6以上查看你的机器的cuda版本(如果没安装的话安装),通过nvcc --version命令查看,然后去安装或者更新相应版本的pytorch。比如我的cuda版本是10.0的,就执行以下命令安装或者更新对应cuda版本的pytorch,不然会报错pip3 install torch==1.4.0+cu100 torchvision==0.5.0+cu100

2020-05-28 20:34:48 3068 2

原创 目标检测数据可视化,分析anchor_ratio的设置问题

网上有很多类似的文章和代码,但是都不怎么好,这里分享一下我打比赛用的。plt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['font.family']='sans-serif'plt.rcParams['figure.figsize'] = (10.0, 5.0)# 这里打开你的训练集的标注,格式是COCO数据集的格式with open('annotation.json') as f: ann=json.load(f)

2020-05-17 07:20:05 1458 10

原创 Twitter异常检测框架BreakoutDetection Python版

前言在Github上最火的异常检测算法就是Twitter的BreakoutDetection了 https://github.com/twitter/AnomalyDetection但是只是R语言的。然而有好多人把它用python实现了一遍:https://github.com/roland-hochmuth/BreakoutDetectionhttps://github.com/i...

2019-06-13 11:23:58 4001 2

原创 一条指令安装fbprophet

去 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 这里搜 Anaconda3-4.3.0.1-Windows-x86_64.exe ,下载安装。这个对应python3.6将 C:\Program Files\Git\cmd;C:\ProgramData\Anaconda36;C:\ProgramData\Anaconda36\Sc...

2019-05-08 10:34:59 3438 5

原创 Affinity Propagation 聚类算法的通俗解释

1. 前言一开始的时候看AP聚类,两个公式的更新看的云里雾里的,不知道代表的什么意思,后来看了一下论文原文和配图终于有点理解了。下面将个人理解写一下。论文: https://www.psi.toronto.edu/affinitypropagation/FreyDueckScience07.pdf2. 解释假设我们有n个数据,需要进行聚类,我们可以想象为有n个人,要投票投出几个leader...

2019-04-03 19:26:43 3661 3

原创 Taf/Tars文档搬运工

最近在看Taf/Tars看到两个GitHub上特别好的文档,真的特别好,建议新手详细读:https://github.com/Myicefrog/learn-tars 腾讯开源框架Tars源码学习笔记—重写Tars rpchttps://github.com/zhuzhongshu/study_tars/tree/master/笔记 tars框架笔记 很有用...

2019-03-21 10:14:26 996 1

原创 从概率的角度看logistic regression

logistic regression假设样本xxx为正的概率是:P(Y=1∣x)=11+e−(w⋅x+b)P(Y=1|x)=\frac{1}{1+e^{-(w\cdot x+b)}}P(Y=1∣x)=1+e−(w⋅x+b)1​我们在看这个公式的时候,可以理解成xxx是一个事件,一共有1,2,…,N个事件YYY是类别,有0和1,这两种类别那么P(Y=1∣x)P(Y=1|x)P(Y=1∣...

2018-11-25 19:56:59 875

原创 LeetCode上的Arry(数组)类型的题目

文章目录Easy905. Sort Array By Parity832. Flipping an Image561. Array Partition I867. Transpose Matrix 矩阵的转置766. Toeplitz Matrix896. Monotonic Array 单调数组485. Max Consecutive Ones 二进制数组中最长的1888. Fair Cand...

2018-11-02 14:41:49 661 1

原创 LeetCode上的Bit Manipulation(位运算)类型的题目

文章目录Easy461. Hamming Distance两个数字的汉明距476. Number Complement 求补码136. Single Number693. Binary Number with Alternating Bits 相互交错的位信息389. Find the DifferenceEasy461. Hamming Distance两个数字的汉明距461. Hamm...

2018-10-31 18:19:31 464

原创 正则化贪心森林RGF(Regularized Greedy Forest)详解和实战

前言因为RGF是一针对GBDT缺点而改进的算法,所以在弄清楚之前,你需要了解GBDT算法的原理,包括了解决策树,boosting算法。一开始接触到RGF的时候,是看了这篇IBM的论文Predicting Disk Replacement towards Reliable Data Centers里面提到用了RGF的算法去预测硬盘故障,惊艳我的是居然预测precision和recall都到98...

2018-10-18 17:42:19 4046 9

原创 xgboost原理

在网上看了xgboost的介绍,很多博客一开始并没有讲的很明白,于是我按照自己的理解写一下xgboost的原理。主要参考了:https://xgboost.readthedocs.io/en/latest/tutorials/model.html (英文详细教程)https://www.jianshu.com/p/7e0e2d66b3d4 (实战xgboost)xgboost的模型为:...

2018-10-17 22:04:22 375

原创 读deeplearningbook笔记

解决上溢和下溢:softmaxSVM:这个函数关于x 是非线性的,关于ϕ(x) 是线性的核函数有用的原因:(1)够使用保证有效收敛的凸优化技术来学习非线性模型;(2)核函数k 的实现方法通常有比直接构建ϕ(x) 再算点积高效很多PCA:将数据变换为元素之间彼此不相关表示SGD:梯度是期望。期望可使用小规模的样本近似估计正则化:L2范数:权重衰减,只有在显著减小...

2018-10-10 14:24:48 236

原创 小白学YOLO - 图解网络的输出到检测出物体的过程

1. 前言上一篇我们介绍了YOLO网络的输出:图解YOLO输入输出这一篇我们介绍一下根据网络的输出到检测出物体的过程。我们上一篇介绍到了:边界框bounding box的类别置信度(class-specific confidence scores):还有边界框bounding box的confidence:2. 输出->识别物体计算bounding box的类别置信度由上...

2018-09-28 10:16:18 2252 2

原创 小白学YOLO - 图解网络和输入输出

1. 前言使用YOLOv2做出来的一个demo:https://v.youku.com/v_show/id_XMzgzOTY3ODY3Mg==.html是做一个导盲宝的产品,是看家宝+语音识别+物体识别的一个AI产品。在我第一次看yolo的时候,看了大神的csdn的博客,看了论文,都还不是很明白,后来自己再搜集了一些资料,再仔细琢磨一下,才明白其中的原理。接下来我就用的理解写一篇笔记。2...

2018-09-27 16:07:18 9945 4

原创 解决样本不均衡的问题-调整类权重 修改交叉熵loss

处理不平衡数据我们在进行机器学习和深度学习的时候,常常会遇到样本不均衡的问题,解决样本不均衡的问题常常有以下几种方法,达到平衡数据集:过采样少数类降采样多数类合成新的少数类调整类权重(误判成本)这篇文章就讲如何通过修改交叉熵loss调整类权重交叉熵误差交叉熵公式如下 这里,log表示以e为底数的自然对数。是神经网络的输出,是正确的标签。并且,中只有正确的标签...

2018-08-30 10:57:41 31737 7

原创 通过mnist数据库学习tfrecords的使用

在用tensorflow跑实验的时候,我原本数据是用sqlite3存数据,然后再从数据库中选择相应的数据出来,但是这样太耗时了,于是便想要用tfrecord来存数据。于是通过mnist数据来试验一下。 先加载:import tensorflow as tfimport numpy as npimport os加载mnist数据库首先先加载mnsit数据库,因为我已经下载好mn...

2018-07-24 14:26:07 607

原创 BasicLSTMCell中num_units参数解释

前言关于LSTM原理: http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 关于LSTM原理(译文):https://blog.csdn.net/Jerr__y/article/details/58598296关于Tensorflow+LSTM的使用:https://www.knowledgemapper.com/knowm...

2018-07-23 11:01:35 15687 34

原创 tensorflow 的 next_batch 实现

使用以下代码可以实现自己数据库的next_batch函数# -*- coding: utf-8 -*-import numpy as np np.set_printoptions(threshold=200) class Dataset: def __init__(self,data,label): self._index_in_epoch = 0 ...

2018-07-09 16:35:23 2585

原创 嵌入式使用Symmetricds进行数据库同步

去 https://www.symmetricds.org/download 下载symmetric-server-3.8.29.zip ,目前最新版本是3.8.29新建maven的webapp项目,将symmetric-server解压之后的web - lib 文件夹下的jar包复制粘贴到项目中去,并build path - add to build pathStroe类import java.

2017-09-05 17:55:43 1464 1

原创 javax.persistence.PersistenceException: [PersistenceUnit: klmsdb] Unable to build EntityManagerFacto

javax.persistence.PersistenceException: [PersistenceUnit: klmsdb] Unable to build EntityManagerFactory 在Stack Overflow找到解决方法,他没错,只不过给了个成功的例子:Stack Overflow原persistence.xml<?xml version="1.0" encoding=

2017-08-10 13:46:04 6144

原创 数据库中的事务的特性和隔离级别 MindJet整理

事务的特性事务的隔离级别

2016-09-20 20:53:12 498

原创 [编程题] LeetCode上的Reservoir Sampling(蓄水池算法)类型的题目

目前LeetCode上Reservoir Sampling只有两道:Linked List Random Node给定一个单链表,随机返回链表中一个节点的值,每个结点被选中的概率相等。注意: 这个链表很大并且长度未知怎么办?思路:蓄水池算法。我们先一般化这个题目,改成:给定一个单链表,随机返回链表中K个节点的值,每个结点被选中的概率相等。先说解法,再解释:从头到尾遍历链表在遍历1~k个结点时,

2016-09-18 22:25:00 5058

原创 怎么才算是好代码 MindJet整理

总结了下平时编程和在大疆实习的时候对怎么才算是好代码的体会:

2016-09-09 22:13:04 499

原创 Java虚拟机中类加载过程 MindJet整理

用MindJet整理了一下Java虚拟机中类加载过程的知识。 不知道怎么把图片调大,大家把浏览器放大一些就能看的清楚了。 参考文献: 《深入理解Java虚拟机》

2016-09-07 21:52:38 434

原创 Java虚拟机中的自动内存管理机制 MindJet整理

参考文献: 《深入理解Java虚拟机》

2016-09-07 15:23:04 441

原创 [编程题] LeetCode上的Tree类型的题目

继之前做完回文动态规划回溯 BackTracking的题目之后,我又做了LeetCode上关于树的题目:https://leetcode.com/tag/tree/在做的过程中有些题没有思路,于是便看了 Discuss 或者《Cracking the coding Interview》和算法导论等书籍,下面从 Easy ~ Hard 给出答案:这里二叉树的结构是:/** * Definit

2016-09-04 21:57:48 1416 1

原创 LeetCode上的Palindrome(回文)类型的题目

回文感觉好恶心,不知道为啥感觉做回文的题脑子就变成浆糊了,所以干脆一口气全部做完它,爽! 所谓回文字符串,就是一个字符串,从左到右读和从右到左读是完全一样的。比如”level” 、 “aaabbaaa”在leetcode上https://leetcode.com/problemset/algorithms/ 的搜索框搜“pali”,它会模糊匹配出来所有的回文的题目:Palindrome Li

2016-09-01 16:47:16 3893 1

原创 Head First 设计模式 里面的设计原则总结 MindJet整理

1. 找出应用中可能需要变化之处, 把他们独立出来 –>引出了–>策略模式2. 针对接口编程,而不是针对实现编程 什么是实现编程 1、行为来自超类的具体实现 2、类实现某个接口自己进行实现 3、new一个对象 –>为了解决这个方法–>工厂模式 以上的行为除了写更多的代码,没办法更改行为,绑的死死的。 3. 多用组合,少用继承。–>提高可维护性和可扩展性 这也是《Ef

2016-09-01 01:45:24 463

原创 LeetCode上的Dynamic Programming(动态规划)类型的题目

继上次把backTracking的题目做了一下之后:backTracking ,我把LeetCode的动态规划的题目又做了一下,还有几道比较难的Medium的题和Hard的题没做出来,后面会继续更新和加详细解法解释~ Dynamic Programming链接:https://leetcode.com/tag/dynamic-programming/难度-EasyClimbing Stairs 爬

2016-08-30 19:26:47 3526 2

原创 LeetCode上的backTracking类型的题目

最近把LeetCode上的backTracking的题目做了一下,发现都是一个套路~ backTracking链接:https://leetcode.com/tag/backtracking/ 还有几道比较难的Medium的题和Hard的题没做出来,后面会继续更新和加详细解法解释~回溯的入门之子集-Subsets这种题目都是使用这个套路,就是用一个循环去枚举当前所有情况,然后把元素加入,递归,再

2016-08-29 17:45:24 1704 1

原创 OkHttp调用HTTPS遇到的问题之:SocketException: Software caused connection abort: recv failed

由于需要,我要不断地调用用OkHttpClient调Https接口(链接),于是有时候会出现下面这个问题:java.net.SocketException: Software caused connection abort: recv failed at java.net.SocketInputStream.socketRead0(Native Method) at java.net

2016-08-09 10:15:34 8157

原创 OkHttp调用HTTPS遇到的问题之:SSLPeerUnverifiedException

关于OkHttpOkHttp学习Https学习最近在用OkHttp调https接口的时候遇到一个问题 javax.net.ssl.SSLPeerUnverifiedException: peer not authenticated.这是由于https请求证书验证问题,直接请求一般都会失败。一般是做证书验证处理或者忽略证书验证。 可是给我https接口的小伙伴说,他们都没使用证书加密。我

2016-08-05 23:36:43 18180 6

原创 [编程题]由异或门引出的几道数组的算法题

以下几道关于数组的编程题,都是用同一个思路扩展出来的,和朋友讨论的时候感觉好有趣,便记录下来。以下是题目:给你n个数,其中有且仅有一个数出现了奇数次,其余的数都出现了偶数次。用线性时间常数空间找出出现了奇数次的那一个数。1到n之间的n - 1个不重复的数,如何快速找出缺少的那个数?1到n之间的n - 2个不重复的数,又如何快速找出缺少的那两个呢?给定一个数组,除了一个数出现1次之外,其余数都

2016-08-05 21:28:23 853 1

原创 [编程题]关于二叉树的路径

题目: 给定一颗二叉树,其中每个结点都含有一个数值。设计一个算法,打印结点数值总和等于某个给定值的所有路径。注意,路径不一定非得从二叉树的根节点或叶子节点开始或结束。题目看起来视乎有点复杂,那么我们先简化一下,若路径从根节点开始,在任意节点结束。 于是就可以从根节点开始,向左向右访问子节点,计算每条路径上根节点到当前节点的数值和。若与给定的值相同变打印当前路劲。 注意:就算找到了总和,人

2016-07-31 19:44:11 1330

原创 [编程题]括号匹配问题

关于括号匹配问题可以扩展出来好几个问题:传统的括号匹配,给出一个字符串,判断里面的括号是否匹配给你一个字符串,里面只包含”(“,”)”,”[“,”]”四种符号,请问你需要至少添加多少个括号才能使这些括号匹配起来。1 传统的括号匹配给定字符串,输出括号是否匹配,例如: ) false () true (a) true []{{}}(aa) true

2016-07-31 16:22:53 2284

原创 Java垃圾收集器知识整理

很早就看了垃圾收集器,只是东看看西看看。之前系统的学习过,不过过一段时间就又忘记了,现在再次整理一下吧。废话说完了,进入正题。我们通过回答下面三个问题来理解Java的垃圾回收机制:哪些内存需要回收?什么时候需要回收?如何回收?哪些内存需要回收答:堆和方法区的内存需要回收。 Java运行时的数据区域可以分为5个:堆、方法区、程序计数器、虚拟机栈、本地方法栈。 其中程序计数器、虚拟机栈、本地

2016-07-25 22:15:57 485

原创 写一个controller调job

在项目中经常会写一些同步的程序,写完之后有时候不想等它到指定时间才运行,于是就了一个controller手动调用job,代码如下:@Controllerpublic class testJobSchedule{ @Autowired Scheduler scheduler; @RequestMaping("/qrtz/{jobName}") @RequestBody

2016-07-23 17:49:47 666

原创 从一次谷歌面试趣事中想到问题的更好的解决办法

事情是这样的,我之前在微博转载过一个谷歌面试趣事,里面讲到一个很有趣的算法,没想昨天被转发了好多次,微博一直提示有人@我。我又进去看了下这篇文章,想到了其实里面的问题还有几个更好的解决办法。谷歌面试趣事传送门:一次谷歌面试趣事 题目的描述是这样的:假设这有一个各种字母组成的字符串,假设这还有另外一个字符串,而且这个字符串里的字母数相对少一些。从算法是讲,什么方法能最快的查出所有小字符串里的字母在大

2016-04-16 10:52:20 548

原创 [编程题]输出蛇形数组 Java版

题目:输入一个数n,输出n*n的蛇形数组。如输入n = 5,输出: 1 2 3 4 5 16 17 18 19 6 15 24 25 20 7 14 23 22 21 8 这道题主要是考虑边数组的边界问题,我们可以先一环一环的进行数组的赋值,代码如下:import java.util.*;public class Main{ public stat

2016-04-14 15:40:02 1442

raw_data.csv

Twitter异常检测框架BreakoutDetection Python版 数据

2019-06-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除