自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

友谊无价

CQUPT

  • 博客(72)
  • 收藏
  • 关注

原创 前缀和与差分

前言记录2个简单的算法及其模板,前缀和与差分。前缀和:能够在O(1)O(1)O(1)时间复杂度内求出数组某一段的和差分:能够在O(1)O(1)O(1)时间复杂度内给数组某一段加上同一个数(或者减去同一个数)前缀和可以在O(1)O(1)O(1)时间内求出一段连续的子数组的和 suma,b=sumb−suma−1sum_{a,b} = sum_b - sum_{a-1}suma,b​=sumb​−suma−1​,suma,bsum_{a,b}suma,b​表示求数组下标从a到b的和。模板#incl

2020-12-09 12:58:18 162

原创 《青春有你2》选手信息爬取

前言最近复习Python基础,正好把之前在aistudio做的爬虫demo复习一下上网全过程:普通用户:打开浏览器 --> 往目标站点发送请求 --> 接收响应数据 --> 渲染到页面上。爬虫程序:模拟浏览器 --> 往目标站点发送请求 --> 接收响应数据 --> 提取有用的数据 --> 保存到本地/数据库。爬虫的过程:1.发送请求(requests模块)2.获取响应数据(服务器返回)3.解析并提取数据(BeautifulSoup查

2020-12-06 17:01:15 1259 1

原创 Python3使用积累

Python3使用积累最近可能要经常使用Python,所以记录一下Python的相关用法。算法竞赛中的积累头写法if __name__ == '__main__':初始化\输入1.读取一维数组arr = list(map(int, input().split(' ')))2.初始化全0的二维数组st = [[0 for col in range(n)] for row in range(m)]3.读入n,mn, m = map(int, input().split(' '

2020-12-06 14:57:36 1948 6

原创 零基础入门NLP赛事 - Task4 基于深度学习的文本分类1-fastText

方法:fasttextfasttext是一种典型的基于深度学习模型的word embedding方法是一个三层神经网络,由输入层、隐含层和输出层表示:核心代码:import pandas as pdfrom sklearn.metrics import f1_score# 转换为FastText需要的格式train_df = pd.read_csv('data/train_set.csv', sep='\t', nrows=15000)train_df['label_ft']

2020-07-27 22:54:53 194

原创 LeetCode23 合并K个排序链表

合并k个排序链表,返回合并后的排序链表。请分析和描述算法的复杂度。示例:输入:[ 1->4->5, 1->3->4, 2->6]输出: 1->1->2->3->4->4->5->6算法1:顺序枚举每次取数组中的2个链表来merge,每次时间复杂度是,空间复杂度是要执行k次,k为数组的长度/** * Definition for singly-linked list. * struc...

2020-07-26 17:08:51 181

原创 零基础入门NLP赛事 - Task3 基于机器学习的文本分类

本节主要采用机器学习的方法来解决文本分类的问题常用的Word Embedding 的方法有 one-hot编码,bag of word, TF-IDF所以思路就是 Embedding + 任意机器学习方法即可1.Onehot + RidgeClassifier# Count Vectors + RidgeClassifierimport pandas as pdfrom sklearn.feature_extraction.text import CountVectorizerf

2020-07-25 22:43:02 124 1

原创 Datawhale零基础入门NLP赛事 - Task2 数据读取与数据分析

用pandas处理一下数据,训练集的shape为(200000, 2),建议刚开始可以读取几百条看看效果,全部读取的话内存大概要12G左右才能进行正常处理。import pandas as pdtrain_df = pd.read_csv('data/train_set.csv', sep='\t')train_df.head()train_df.shape数据分析在读取完成数据集后,我们还可以对数据集进行数据分析的操作。虽然对于非结构数据并不需要做很多的数据分析,但通过数据分析还是可

2020-07-22 22:40:08 134

原创 LeetCode Best Time to Buy and Sell Stock专题

LeetCode 121. Best Time to Buy and Sell Stock给定一个数组,它的第i 个元素是一支给定股票第 i 天的价格。如果你最多只允许完成一笔交易(即买入和卖出一支股票一次),设计一个算法来计算你所能获取的最大利润。注意:你不能在买入股票前卖出股票。输入: [7,1,5,3,6,4]输出: 5解释: 在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。 注意利润不能是 7-.

2020-07-22 09:52:44 136

原创 Datawhale零基础入门NLP赛事 - Task1 赛题理解

要求:对新闻文本进行分类标签:整合划分出14个候选分类类别,财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。数据构成:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。为了预防选手人工标注测试集的情况,我们将比赛数据的文本按照字符级别进行了匿名处理。测试指标:f1_score主要思路:...

2020-07-21 22:11:28 117

原创 LeetCode1510. 石子游戏 IV

1510. 石子游戏 IV难度困难6Alice 和 Bob 两个人轮流玩一个游戏,Alice 先手。一开始,有n个石子堆在一起。每个人轮流操作,正在操作的玩家可以从石子堆里拿走任意非零平方数个石子。如果石子堆里没有石子了,则无法操作的玩家输掉游戏。给你正整数n,且已知两个人都采取最优策略。如果 Alice 会赢得比赛,那么返回True,否则返回False。示例一:输入:n = 1输出:true解释:Alice 拿走 1 个石子并赢得胜利,因为 Bob...

2020-07-21 10:54:04 446

原创 LeetCode1515 服务中心的最佳位置

1515. 服务中心的最佳位置一家快递公司希望在新城市建立新的服务中心。公司统计了该城市所有客户在二维地图上的坐标,并希望能够以此为依据为新的服务中心选址:使服务中心到所有客户的欧几里得距离的总和最小。给你一个数组positions,其中positions[i] = [xi, yi]表示第i个客户在二维地图上的位置,返回到所有客户的欧几里得距离的最小总和 。换句话说,请你为服务中心选址,该位置的坐标[xcentre, ycentre]需要使下面的公式取到最小值:与真...

2020-07-20 12:59:31 1347

原创 LeetCode1514概率最大路径

1514. 概率最大的路径给你一个由 n 个节点(下标从 0 开始)组成的无向加权图,该图由一个描述边的列表组成,其中 edges[i] = [a, b] 表示连接节点 a 和 b 的一条无向边,且该边遍历成功的概率为 succProb[i] 。指定两个节点分别作为起点 start 和终点 end ,请你找出从起点到终点成功概率最大的路径,并返回其成功概率。如果不存在从 start 到 end 的路径,请 返回 0 。只要答案与标准答案的误差不超过 1e-5 ,就会被视作正确答案。输入

2020-07-19 00:23:57 331

原创 PARL 强化学习框架学习

最近参加了百度的的PARL深度强化学习课程,算是对强化学习有了一定了解,因为之前并没有学习过强化学习相关的知识,粗略入门,体验了PARL框架,确实对新手比较友好。入门学习了比较基础的算法,如SARSA,Q-Learning,DQN,PG,DDPG。能在AI studio上直接跑模型,直接感受模型的效果,对入门学习比较有帮助。强化学习主要了解3个概念,agent,model,algorithm下面是代码实例,以DQN为例modelclass Model(parl.Model):

2020-06-24 23:36:25 967 1

原创 Paddle入门体验

这段时间学习了paddle关于CV方向的一些技巧,首先paddle1.7更新成了动态图,使用起来和Pytorch的感觉很像了,基本可以马上迁移过来。然后是相关配套的文档,真的非常详细,看着demo配合文档基本没啥问题了。比较nice的感觉是,体验了paddlehub,可以快速加载预训练模型,跟PytorchHub的效果一样。还有paddle一看就是工程实践出来的框架,还配备了部署和模型压缩,体...

2020-04-08 10:37:13 455

原创 零基础入门数据挖掘 task5

Datawhale 零基础入门数据挖掘-Task5 模型融合五、模型融合Tip:此部分为零基础入门数据挖掘的 Task5 模型融合 部分,带你来了解各种模型结果的融合方式,在比赛的攻坚时刻冲刺Top,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784...

2020-04-05 15:45:26 99

原创 零基础入门数据挖掘 task4

Datawhale 零基础入门数据挖掘-Task4 建模调参四、建模与调参Tip:此部分为零基础入门数据挖掘的 Task4 建模调参 部分,带你来了解各种模型以及模型的评价和调参策略,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introdu...

2020-04-01 21:06:49 653

原创 零基础入门数据分析 task3

Datawhale 零基础入门数据挖掘-Task3 特征工程¶三、 特征工程目标Tip:此部分为零基础入门数据挖掘的 Task3 特征工程 部分,带你来了解各种特征工程以及分析方法,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduc...

2020-03-27 20:41:04 198

原创 零基础入门数据分析 Task2

一、赛题数据赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏二、评测标准评价标准为MAE(Mean Abs...

2020-03-24 21:45:52 229

原创 《动手学深度学习》学习笔记

文本预处理常见的四个步骤:读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型import collectionsimport redef read_time_machine(): with open('/home/kesci/input/timemachine7163/timemachine.txt'...

2020-02-19 20:39:22 244

原创 《动手学深度学习笔记》

1.从零开始实现线性回归下面是用pytorch从零开始实现一个线性回归import torchfrom IPython import displayfrom matplotlib import pyplot as pltimport numpy as npimport random# 生成数据集# set input feature number num_inputs =...

2020-02-14 19:39:16 174

原创 [HDUOJ] 1004 Let the Balloon Rise

题意:给气球的颜色,求数量最多的颜色。分析:map乱搞代码:#include<stdio.h> #include<cstring> #include<algorithm> #include<iostream>#include<vector>#include<set>#include<string>#include<sstream>#include<map>#include<l

2017-05-11 20:22:03 245

原创 [POJ] 3984 迷宫问题

题意:给定一个5*5的迷宫,求从左上角到右下角的最短路径。分析:BFS跑一下最短路,这里学习一下保存输出最短路径的方法。代码:#include<stdio.h> #include<cstring> #include<algorithm> #include<iostream>#include<vector>#include<set>#include<string>#include<

2017-05-11 19:12:53 204

原创 [POJ] 2251 Dungeon Master

题目: https://vjudge.net/contest/156770#problem/B题意: 一个三维的地牢,依次给出地牢的高长宽,并给出每一层的具体内容。S起点,E终点,求最短的步数。分析: 一眼看就是三维的DFS或BFS,然后不信邪,跑了一下DFS就TLE了,最后跑个BFS才过的。把以前的4个方向变成6个就可以了。 代码:#include<stdio.h> #include<c

2017-04-27 16:10:34 579

原创 [HDU] 1754 I Hate It

题目: 很多学校流行一种比较的习惯。老师们很喜欢询问,从某某到某某当中,分数最高的是多少。 这让很多学生很反感。 不管你喜不喜欢,现在需要你做的是,就是按照老师的要求,写一个程序,模拟老师的询问。当然,老师有时候需要更新某位同学的成绩。 Input 本题目包含多组测试,请处理到文件结束。 在每个测试的第一行,有两个正整数 N 和 M ( 0#include<iostream>#inc

2017-04-12 14:35:16 333

原创 [POJ] 1509 Glass Beads

题目: Ray又对数字的列产生了兴趣: 现有四张卡片,用这四张卡片能排列出很多不同的4位数,要求按从小到大的顺序输出这些4位数。 Input 每组数据占一行,代表四张卡片上的数字(0<=数字<=9),如果四张卡片都是0,则输入结束。 Output 对每组卡片按从小到大的顺序输出所有能由这四张卡片组成的4位数,千位数字相同的在同一行,同一行中每个四位数间用空格分隔。 每组输出数据间

2017-04-01 22:01:17 320

原创 [CF] 785B Anton and Classes

题目: Anton likes to play chess. Also he likes to do programming. No wonder that he decided to attend chess classes and programming classes.Anton has n variants when he will attend chess classes, i-th v

2017-03-29 15:36:19 573

原创 [CF] 785A Anton and Polyhedrons

题目: Anton’s favourite geometric figures are regular polyhedrons. Note that there are five kinds of regular polyhedrons:Tetrahedron. Tetrahedron has 4 triangular faces. Cube. Cube has 6 square faces.

2017-03-29 15:32:41 336

原创 [CF] 787B Not Afraid

题目: Since the giant heads have appeared in the sky all humanity is in danger, so all Ricks and Mortys from all parallel universes are gathering in groups to find a solution to get rid of them.There ar

2017-03-29 15:30:35 872

原创 [CF] 787A The Monster

题目: A monster is chasing after Rick and Morty on another planet. They’re so frightened that sometimes they scream. More accurately, Rick screams at times b, b + a, b + 2a, b + 3a, … and Morty screams

2017-03-29 15:25:34 390

原创 [HDU] 1027 Ignatius and the Princess II

题目: Now our hero finds the door to the BEelzebub feng5166. He opens the door and finds feng5166 is about to kill our pretty Princess. But now the BEelzebub has to beat our hero first. feng5166 says, “

2017-03-27 15:50:42 467

原创 [UVA] 540 Team Queue

题目: Queues and Priority Queues are data structures which are known to most computer scientists. The Team Queue, however, is not so well known, though it occurs often in everyday life. At lunch time th

2017-03-27 15:48:02 366

原创 [UVA] 10815 Andy's First Dictionary

题目: Andy, 8, has a dream - he wants to produce his very own dictionary. This is not an easy task for him, as the number of words that he knows is, well, not quite enough. Instead of thinking up all th

2017-03-27 08:45:07 328

原创 [UVA] 101 The Blocks Problem

题目: Many areas of Computer Science use simple, abstract domains for both analytical and empirical studies. For example, an early AI study of planning and robotics (STRIPS) used a block world in which

2017-03-24 11:05:58 359

原创 [UVA]10474 Where is the Marble?

题目: Raju and Meena love to play with Marbles. They have got a lot of marbles with numbers written on them. At the beginning, Raju would place the marbles one after another in ascending order of the nu

2017-03-24 09:58:10 360

原创 [蓝桥杯]2017.3.19 B题

题意:就是给一个1-n的队伍。输入a,b:把a数在原来的位置改到+b的位置,就是随便一个vector就可以解决的问题,然后并不会stl,现在熟练stl先!分析:见上;代码:#include<iostream>#include<vector>using namespace std ; vector<int> vec ;int main(){ //freopen("in.txt","r",s

2017-03-21 23:52:09 543

原创 [FZU] 1062 洗牌问题

题目: 设2n张牌分别标记为1, 2, …, n, n+1, …, 2n,初始时这2n张牌按其标号从小到大排列。经一次洗牌后,原来的排列顺序变成n+1, 1, n+2, 2, …, 2n, n。即前n张牌被放到偶数位置2, 4, …, 2n,而后n张牌被放到奇数位置1, 3, …, 2n-1。可以证明对于任何一个自然数n,经过若干次洗牌后可恢复初始状态。现在你的的任务是计算对于给定的n的值(n≤1

2017-03-12 10:46:43 369

原创 [HDU] 1106 排序

题目: 输入一行数字,如果我们把这行数字中的‘5’都看成空格,那么就得到一行用空格分割的若干非负整数(可能有些整数以‘0’开头,这些头部的‘0’应该被忽略掉,除非这个整数就是由若干个‘0’组成的,这时这个整数就是0)。 你的任务是:对这些分割得到的整数,依从小到大的顺序排序输出。 Input 输入包含多组测试用例,每组输入数据只有一行数字(数字之间没有空格),这行数字的长度不大于1000。

2017-03-12 09:46:10 395

原创 [FZU] 1475 不同的单词

题目: 给出一个英文单词的列表,计算有多少不同的单词在列表中。 Input 本题有多组输入数据,你必须处理到EOF为止每组数据的第一行有一个整数n, 1<=n<=1000.下面的n行每行一个单词,每个单词的长度不超过20。单词大小写忽略。Output 每组数据输出一个整数,表示不同的单词数。 Sample Input 5 FZU FzU LOY BNh FZU Sample

2017-03-11 21:08:18 336

原创 [CSU] 1087 就多了两分钟

题目: Yucept21和他的室友Zyn因为宿舍没电去网吧上网,上了27分钟,Cs打电话来说来电了。所以Yucept21在第29分钟下机了,上网的费用是一块钱,然后Zyn墨迹了两分钟,第31分钟下机,上机费用是2元。现在知道网吧是按照半个小时计费的,假设半个小时上机的费用是1块钱。现在给你两个时间点,要你求出上机费用和再上多少分钟最划算?(最划算是指上满这个三十分钟,比如上机一个小时四十五分钟,

2017-03-11 20:52:54 456

原创 [HDU] 1879 继续畅通工程

题目: 省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可)。现得到城镇道路统计表,表中列出了任意两城镇间修建道路的费用,以及该道路是否已经修通的状态。现请你编写程序,计算出全省畅通需要的最低成本。 Input 测试输入包含若干测试用例。每个测试用例的第1行给出村庄数目N ( 1< N < 100 );随后的 N(N-1)/

2017-03-11 09:14:55 373

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除