自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 NLP 英文文本数据增强

数据增强是一种有效的防止过拟合并且可以加大训练集的有效方式,NLP中的数据增强方法有回译,同义词替换,随机插入,随机交换,随机删除,对抗训练这几种方式,本篇文章简单介绍一下这几种方式。1.回译#经过测试,这个翻译的包翻译的时间是最短的from pygtrans import Translatedef backTran(wordss): client = Translate() text1 = client.translate(wordss) text2 = client.

2021-08-13 10:12:54 1224 3

原创 DataWhale 组队学习总结

很开心可以参加这一次的组队学习,在这次学习中,主要学到了深度学习的知识,了解了什么是梯度,梯度下降的方法,以及梯度下降会遇到的问题,还有解决方法。知道了什么是深度学习,并且知道了一些调参的方法,学会很多,也交到了很多朋友,希望下次组队学习再见...

2021-07-26 21:16:02 306

原创 CNN-卷积神经网络

为什么要用cnn当我们在训练的时候,我们会期待每个神经网络都是一个分类器,比如说第一层是最简单的分类器,它做的事情是判断有没有红色出现,第二层会比较复杂,它根据第一层的输出,来判断第三层根据第二层的输出来进行判断但是出现一个问题,当我们用完全连接的前馈网络来做图像处理的时候,往往我们会需要很多的参数,比如说一张图片(100100),把它变成一个向量,就是3100*100,维度就很大,这样造成最后的参数就很多,而cnn做的是这样一件事情,简化神经网络的架构,将有些不必要的特征给剔除掉。这样会方便很多

2021-07-24 15:03:32 455 2

原创 2021-07-19

最优失败的原因在梯度下降的过程中,会找到局部最优点和鞍点。如果说是找到局部最优解,那么我们是无法再进行优化的,如果说是找到鞍点,那么我们还是可以解决的。那么我们怎么判断是局部点还是鞍点呢?泰勒展开式...

2021-07-21 23:19:03 86

原创 机器学习笔记三--误差从哪来&梯度下降

错误的来源误差和偏差估测我们训练的模型其实是一个估测的结果,预估的结果。就像我们打靶一样,真实值是靶心,我们投的位置是我们的训练好的模型预估的结果偏差的计算如果我们要估算一个变量的平均值和方差,我们估算出来的平均值和真实的平均值是不一样的。但是如果我们利用样本平均值再求期望的话,这个值会接近真实平均值,那么这样的估计叫无偏估计。但这个每次的估计虽然会接近真实平均值,但始终又和真实平均值是有误差的。而这个误差就可以用方差variance来表示,variance的值和我们的样本数量密切相关。如

2021-07-16 16:37:48 248

原创 机器学习笔记---回归(regression)

regression应用1.股票预测:给定股票的历史数据,来预测股市明天的平均值2.推荐系统:给定不同商品的特性,来预测购买某商品的可能性3.自动驾驶:无人车上各个传感器的数据,来预测方向盘的角度4.以及本节课重点讲解的预测宝可梦的cp值:给定进化前的cp值,物种,血量,重量等,来预测进化后的cp值加一点自己的理解,感觉预测也可以叫判断或者计算regression步骤step1:model选定一个model来进行训练,视频中选用的是线性模型,用训练资料去找一个最好的function其实就

2021-07-14 13:27:27 297

原创 机器学习笔记(一)

机器学习笔记机器学习与人工智能的关系人工智能是达成的目标机器学习,深度学习是一种达到目标的方法[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T9mgrWNo-1626100080671)(C:\Users\lph\AppData\Roaming\Typora\typora-user-images\image-20210712213954373.png)]通过后天的学习来习得一种能力。告诉机器一段声音,这段声音是”HI“,机器就学会了“HI"告诉机器一张图片代表”

2021-07-12 22:28:48 138 3

原创 分块学习笔记 (一)

1.什么是分块给定一个数组,长度为n,把他分成m个小块,然后遇到什么区间更新的操作的时候,就可以大大的减少复杂度2.怎么分块通常我们把长度为n的数组分为ceil(n/sqrt(n))块,然后用l[maxn],r[maxn],数组来记录每一块的左边界和右边界。用数组belong[x]来记录x是属于哪一个块的。3.分块初始化void build(int n){ int B=sqrt(n...

2019-06-05 20:12:02 370

原创 牛客想开了大赛二--n的约数(求在[1,n]内约数个数最多的数的约数个数)

传送们题意给定一个t接下来t行每行给一个n,求[1,n]中的约数最多的数的约数输入格式``第一行一个正整数t之后t行,每行一个正整数n输出格式输出t行,每行一个整数,表示答案输入513911316输出64166数据范围1=<n=1e18思路这道题刚刚看到数据范围的时候,就知道不能够暴力,也没有想到其他想法,就在网上看了题解。大题思...

2019-06-04 20:56:17 583

原创 链接的基本概念

什么是链接链接是将各种代码和数据片段收集并组合成为单一文件的过程编译器驱动程序int sum(int *a,int n);int array[2]={1,2};int main(){ int val=sum(array,2); return val;}main.cint sum(int *a,int n){ int i,s=0; for(i=0...

2019-05-31 19:42:45 800

原创 链接--库打桩

什么是打桩简单的来说就是用自己的函数来替换共享库的函数,比如用自己写的mymalloc()来替换系统库中的malloc()怎么实现打桩编译时进行打桩原理在生成重定向文件时将目标函数进行替换调用example#include <stdio.h>#include <malloc.h>int main(){ int *p=malloc(32); ...

2019-05-06 10:55:03 869

原创 字典树

在我们的网络生活中,处处都有热搜的身影,这天某某某递出了律师函,那天某站又泄露了源码,等等那么,这个热搜是怎么实现的呢?一种办法,我可以用一种数组,下标是关键词,然后键值是被搜索的次数,然后每次被检索后都进行一次排序,emmm,这种办法虽然简单,但是时间复杂度和空间复杂度都很大,如果应用到现实生活中,没有什么效率,那么我们有更好的办法吗?当然是有的,在网上找的资料上,可以用很多中方法实现,这...

2019-04-28 21:48:50 4002 1

原创 2050(ccpc)-分宿舍(1103)

题目描述“那天TA说TA要来,于是我就来啦。那天我说我要来,于是你就来啦。TA看到了什么?你又看到了什么?我看到你们在一起,我是真的很happy:)太阳在哪里啊?就在早上七八点。太阳在哪里啊?就在云的栖息地!”——2050主题曲2050的线下活动吸引了很多心怀梦想的年轻人。小伙们打算组团去参加。他们一共有 n+m+2k 个人,包括 n+k 个男生,m+k 个女生,其中 k ...

2019-04-13 22:12:00 454

原创 2050(ccpc)-时间间隔(1002)

描述2019年1月1日,在云栖出现了可能是全世界最长的以秒为单位的倒计时装置:九亿多秒倒计时,直到2050年。给出一个时间S,我们想知道S距离2050年1月1日0点0时0分多少秒。因为答案可能很大,请输出答案模100的值。input第一行一个正整数 T (1≤T≤100000) 表示数据组数。对于每组数据,一行一个字符串表示时间。时间格式为:YYYY-MM-DD HH:MM:SS,分...

2019-04-13 22:05:13 1132

原创 牛客小白月赛13_小A买彩票

传送门题目描述小A要买彩票,一张彩票3元,而彩票的中奖金额是1,2,3,4元,而且各种金额的中奖概率是一样的,现在他连续购买来n张彩票,他希望他至少能够不亏本的概率是多少?输入描述一行一个n,代表他购买的彩票数量输出描述输出一个-最简分数a/b,代表他不亏本的概率,若概率为1,则输出1/1,概率为0,则输出0/1样例23/80=<n<=30;思路对于n张彩票,...

2019-04-13 21:40:55 309 2

原创 codeforces #550-F(二分图判定)

传送门题意:给定一个无向图,判断它可不可以变成一个有向图,使得这个图不存在长度为2的路径输入第一行输入 n,m代表有n个点,m条边接下来m行代表输入ui,vi 代表ui,vi 是一条边输出如果可以构成的话,那么首先输出一个YES,然后输出一个只有01组成的序列,0的话代表是ui指向vi1的话是代表vi指向ui否则输出NO样例6 51 52 11 43 16 1...

2019-04-10 21:00:39 189

原创 牛客练习赛43-b-Tachibana Kanade Loves Probability(求小数点后k位)

传送门题目大意给定t个数据每个数据给出a,b,k1,k2四个数要求求出a/b 小数点后第k1位到k2位的数字样例52 3 2 31 7 1 72 5 1 312345 54321 3 1012345 54321 100000 1000106614285714007260175678428232175思路这道题的话,我们可以通过模拟除法来解决,但是仔细看数据范...

2019-04-05 23:14:11 176

原创 哈尔滨工程大学ACM预热赛-E-Mother's Day

传送门题目描述给你4个整数a,b,c,y,代表y年的a月的第b个星期c,输出这个日期如果这个日期不存在,那么就是输出none样例4 2 7 20184 1 7 20182 5 4 20182 4 3 20182018/04/082018/04/01none2018/02/28思路由题目可知 1850 年 1月1日是星期二那么我们就可以根据当前给的时间来计算与上面那...

2019-04-05 15:50:11 191

原创 哈尔滨工程大学ACM预热赛-diagrams(dp+高精度)

传送门题目描述小虎刚刚上了幼儿园,老师让他做一个家庭作业:首先画3个格子,第二行有2个格子,第三行有1个格子。每行的格子从左到右可以放棋子,但要求除第一行外,每行放的棋子数不能超过上一行的棋子。玩了一会儿,小虎问大哥大虎:这个作业有很多种摆放法,我想都找到,但我不知道有多少中方案,你能帮助我么?大虎是学校信息学集训队的,立刻想到用计算机来解决这个问题,并很快有了解答:13。第二天他把问题拿到...

2019-04-05 14:32:02 310

原创 The XOR Largest Pair(字典树+贪心)

题目描述在给定的 N 个整数 A1,A2,…,AN中选出两个进行异或运算,得到的结果最大是多少?输入第一行一个整数 NN。第二行 NN 个整数 AiAi 。输出一个整数表示答案。输入样例52 9 4 7 0输出样例14数据范围1<=N<=105,0<=Ai<231思路此题不看数据范围的话肯定会想到暴力,但是数据范围就写在那里,怎么办呢?其实看...

2019-04-04 16:54:35 240

原创 一.Default Constructor(默认构造函数)

default constructor 会在需要的时候被编译器产生出来,这个需要怎么理解呢?我们可以看看下面的代码:class link{public:int val; link *next;}void text1(){ link tmp; if(tmp.val||tmp.next){ // }}在上面的代码中,我们看到,在text1函数里的判断...

2019-03-29 13:49:55 1757

原创 STL-学习--set(1)

在c++里面有这样的数据结构,它叫set(集合),它具有和数学上集合一样的性质,运算,而且,它内部还有序。1.set 的基本操作#include &lt;iostream&gt;#include &lt;set&gt;//set需要的头文件using namespace std;set&lt;int&gt;mp;//&lt;&gt;里面填各类数据类型,这里涉及到cpp模板技术int m...

2019-03-16 23:07:26 187

原创 二维前缀和入门例题_海啸

传送门题目大意给你一个矩阵,然后再给你一个数d,然后再给q个询问,每次次询问会给出要查询的子矩阵的左上角和右下角,然后要给出子矩阵中有多少个数字是大于等于d的题目分析显然,看到这种题目,我首先会想到的是暴力,但是仔细想一想,没那么简单,毕竟数据范围那么大,暴力超时可是妥妥的,怎么办呢?其实这个问题是不是在哪里见过呢?涉及到区间问题,一维下我记得有个东西叫做前缀和,可以在O(1)的情况下查...

2019-03-02 23:13:18 445

原创 区间异或(牛客寒假集训6)

传送门题目大意给定一个区间,使得这个区间里面的每个数都异或,求异或后的答案数据范围(0=&lt;l&lt;=r&lt;=10^18)注意是多组输入题目分析刚刚开始看到这一题的时候,感觉不是那么容易的,比赛的时候,看了一眼,就认为这可能是个数论题,就没有做它,今天又重新做一遍,感觉是自己比赛的时候,太慌了,才会认为它很难。其实仔细分析一下,以及画画图,会发现,对于两个区间端点,只有两种...

2019-03-02 18:02:21 922

原创 交换瓶子-蓝桥杯

题目大意有N个瓶子,编号 1 ~ N,放在架子上。比如有5个瓶子:2 1 3 5 4要求每次拿起2个瓶子,交换它们的位置。经过若干次后,使得瓶子的序号为:1 2 3 4 5对于这么简单的情况,显然,至少需要交换2次就可以复位。如果瓶子更多呢?你可以通过编程来解决。输入格式:第一行: 一个正整数N(N&lt;10000), 表示瓶子的数目第二行:N个正整数,用空格分开,表示瓶子...

2019-02-27 19:39:27 377 2

原创 愤怒的牛-二分

传送门本道题目讲的是一个农夫有c头牛和n个隔间,题目会给出每个隔间的位置,因为一个隔间只能装一头牛,所以农夫要给c头牛安排位置,要求任意两头牛的位置的最小值是最大的解题思路刚刚看到这个题目的时候,很懵逼,感觉不是很适应,后面就直接去看的题解题解上是这样说的,二分任意一头牛之间的最小距离,如果满足判断,那么再往更大的值找,如果不满足,那么就往小的值找,听上去好像有点道理哈。emm,判断函数感...

2019-02-26 19:42:36 334

原创 ac自动机初学笔记

最近在做题的过程中遇到一道题,它要求找出一个字符串中出现了多少中之前给的模式字符串,刚刚看到这个题的时候,第一反应就是暴力,但是仔细想想,怎么可能是暴力呢,后来就去看了博客,才知道这是ac自动机1.什么是ac自动机ac自动机是一种用于多模式匹配的数据结构2.为什么要使用ac自动机?因为使用ac自动机会更快的解决多模式匹配的问题原理用我自己的话来说,就是,在已经构建的模式串的字典树中进...

2019-02-25 21:26:53 178

原创 hdu-3336 Count the string

传送门题目描述就是计算字符串中每一个前缀出现的次数,然后把这些次数给加起来就是答案,然后最后要把这个答案mod1007.eg:对于字符串abab它的前缀是a,ab,aba,abab它们分别出现的次数为2,2,1,1所以答案就是6输入描述第一行给一个T,代表有t组数据接下来T个数据,首先会有一个数字n(1&lt;=n&lt;=200000),代表是字符串的长度然后是一个字符串输...

2019-02-24 17:37:09 164

原创 codeforce-1105c

codeforce-1105c题意给定一个区间[l,r],用这里面的数组组成一个长度为n的数列,要求该数列之和是能被3整除,输出有多少种方案满足上面的条件,答案要mod(1e9+7);InputThe first and only line contains three integers n, l and r (1≤n≤2⋅105,1≤l≤r≤1091≤n≤2⋅105,1≤l≤r≤109)...

2019-02-22 22:30:28 436

原创 天梯赛-L2-026-小字辈(并查集加记忆化思想)

传送门题目描述本题给定一个庞大家族的家谱,要请你给出最小一辈的名单。输入格式:输入在第一行给出家族人口总数 N(不超过 100 000 的正整数) —— 简单起见,我们把家族成员从 1 到 N 编号。随后第二行给出 N 个编号,其中第 i 个编号对应第 i 位成员的父/母。家谱中辈分最高的老祖宗对应的父/母编号为 -1。一行中的数字间以空格分隔。输出格式:首先输出最小的辈分(老祖宗的...

2019-02-22 21:18:32 725

原创 天梯赛L2-008-最长对称子串

传送门题意对给定的字符串,本题要求你输出最长对称子串的长度。例如,给定Is PAT&amp;TAP symmetric?,最长对称子串为s PAT&amp;TAP s,于是你应该输出11。输入格式输入在一行中给出长度不超过1000的非空字符串。输出格式:在一行中输出最长对称子串的长度。输入样例:Is PAT&amp;TAP symmetric?输出样例:11思路关于这道...

2019-02-22 21:02:47 283

原创 将vim里面的内容复制到系统剪切板上

一.具体操作先进vim里面,在normal模式下用:reg,查看有没有+开头的行如果没有,则在终端里面使用sudo apt-get install vim-gnome上述步骤完成之后,我们就执行以下步骤在非编辑模式下按住大写的V进入可视模式在选定区域后,使用+y进行复制(同理在vim里面粘贴系统剪切板里面的内容使用+p命令)二.为什么在vim下要这样复制才能复制到剪切板...

2019-01-11 12:26:05 6019 3

原创 使用git更新自己的远程仓库

一.更新本地仓库1.进入仓库文件夹,手动加入新文件,然后用 git add 文件名 加入到缓存区2.用git commit -m “提交信息” 命令 将缓存区里面的内容加入到本地仓库中二.将本地仓库更新到远程仓库1.进行这个步骤之前要完成前面的步骤2.关联到远程仓库:git remote add origin 地址3.将远程库与本地同步合并:git pull --rebase o...

2019-01-08 21:22:13 6595

原创 KMP算法

参考博客:  https://www.cnblogs.com/yjiyjige/p/3263858.htmlnext数组int next[500];void get_next(char *t){ int j,k; j=0; k=-1; next[0]=-1; while(j&amp;lt;tlen) { if(k==-1||t[j]==t[k]) { next[++j]...

2018-12-19 17:11:00 123

原创 二分套二分---poj 3685 Matrix(注意观察式子);

二分套二分—poj 3685 Matrix​ 题目链接:http://poj.org/problem?id=3685 题意:​ 一个正方形矩阵,每次询问先给出边长n,然后在矩阵里面的数每一个都满足上面的那个式子,之后会给出一个k,代表要求这个矩阵里的第k小数。解题思路: 仔细观察这个式子发现,当i固定的时...

2018-06-08 23:38:19 349

原创 关于时间复杂度的一点简单总结

关于时间复杂度的一点简单总结算法的复杂度分为时间复杂度和空间复杂度,今天在这里主要讲一下时间复杂度。一.什么是时间复杂度:​ 时间复杂度,简单来说,就是通过程序语句的执行次数来估计程序运行时间的一个函数,用O表示。(在相同硬件和软件的情况下);可以把它认为就是花费时间的函数的数量级。二.为什么要注意时间复杂度?简单来说,就是为了提高计算机工作的效率,因为现实...

2018-06-08 17:45:48 2717 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除