自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 李宏毅2020机器学习作业——Linear Regression

李宏毅2020机器学习作业——Linear Regression一、问题描述​ 1. 数据描述​ 本次作业采用的数据是使用台湾某一座城市的观测记录,分别为train.csv,test.csv,其中train.csv共有4320行, 27列,包含了该地点18种化合物一年12个月,每月钱20天,每天24小时的数值监控,test.csv则是从剩下资料当中取出的连续10小时为一组,前九个小时的观测值当做特征,第十小时的pm2.5当做answer,一共取出240组不重复的数据2. 问题要求​ 预测t

2020-07-26 20:44:56 1212 5

原创 零基础入门NLP - 新闻文本分类Task3

零基础入门NLP - 新闻文本分类一、学习目标1.学习TF-IDF的原理2.使用sklearn的机器学习模型完成文本分类二、One-hot首先我们要知道,计算机是无法识别中文的,所以我们需要将文本数据转为向量化的形式,最简单的方式就是one-hot形式,即将每个单词使用一个离散的向量表示,如1.机器学习2.深度学习对这两个词,我们如果按字分割,然后对每个字取一个索引,则为{“机”:1,“器”:2,“学”:3,“习”:4,“深”:5,“度”:6}所以对“机器学习”这个词,它就可以转

2020-07-25 23:31:56 131

原创 零基础入门NLP——数据读取与数据分析

零基础入门NLP——数据读取与数据分析一、数据读取赛题数据虽然是文本数据,每个新闻是不定长的,但任然使用csv格式进行存储。因此可以直接用Pandas完成数据读取的操作。import pandas as pdtrain_df = pd.read_csv('train_set.csv', sep='\t', nrows=100)这里的read_csv由三部分构成:读取的文件路径,这里需要根据改成你本地的路径,可以使用相对路径或绝对路径;分隔符sep,为每列分割的字符,设置为\t即可;读取行

2020-07-22 23:11:59 314

原创 零基础入门NLP赛事——赛题理解

零基础入门NLP赛事——赛题理解一、赛题数据赛题以新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。赛题数据由以下几个部分构成:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。为了预防选手人工标注测试集的情况,我们将比赛数据的文本按照字符级别进行了匿名处理。处理后的赛题训练数据如下:labeltext

2020-07-21 17:32:47 203

原创 指下码上横戈行——二分法

指下码上横戈行——二分法今天学习一个很基础的算法——二分法,在接触计算机算法之前,十三就接触过二分法,高中时期数学课上面,求单调函数零点时,采取二分法可以快速地缩小根的取值范围,更快地求得零点,由此可见,二分法可以用来也是主要用来解决查找方面的问题。使用二分法进行查找需要注意,查找的对象必须是有序的数组,二分查找算法的时间复杂度为logn,是一个性能上比较好的算法了,十三在这里多说一句,二分法...

2020-02-11 16:59:34 134

原创 指下码上横戈行——递归浅谈

指下码上横戈行——递归浅谈什么是递归,十三大一下学期上C语言课的时候,老师就在课上面讲过递归的知识,然而十三当时并没有懂,迷迷糊糊地只是把递归地两个条件记住了,一个是递归需要终止条件,另一个是递归的表达式,然后背了几个经常出现地递归函数,应付完了考试,然而却没有弄清楚递归的本质,现在十三做一些算法习题时,看有些题目的题解,说本题可以采取递归的方法求解,十三脑子里面一堆问号,说到底还是递归理解的不...

2020-01-30 01:42:17 222

原创 PAT A 1025

PAT A 1025题目链接原题链接题目描述要求最先输入考场数目n,再依次输入每个考场的考生数目k,考生的id,分数,最后输出总体考生数,并按照考生分数从高到低的次序输出每一个考生的id,总排名,考场号,所在考场排名,这里需要注意的是,分数一致的考生名次相同,下一位考生的名次则等于他所处的相对位置。Sample Input:251234567890001 951234567890...

2020-01-23 19:04:53 122

原创 指下码上横戈行——排序

常见的排序算法有冒泡排序,选择排序,堆排序,快速排序这几种,但十三写博客的目的是为了提高自己的编程解题能力,故在这里介绍如何能快速解决那些涉及到排序的编程问题,首先针对这些问题C++ STL库中已经有了sort函数可以供我们直接调用。sort()函数​ 使用sort()函数必须需要加上头文件#include和using namespace std; 其使用的格式如下:sort(首元素地址, ...

2020-01-22 00:27:45 117

原创 机器学习笔记1

什么是机器学习​ 先看大佬对它的定义A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves ...

2020-01-21 15:33:10 164

原创 Codeforces 158A Next Round

题目链接原题链接题目描述题意很简单,要求按照大小顺序输入n个数据并判断大于第k个数据的非零数字个数Examplesinput8 510 9 8 7 7 7 5 5output6input4 20 0 0 0output0问题解法我的思路博主英语挺菜的,开始并没有看懂题意,所以开始绕了弯路开始光看example的输出案例,想当然的认为是大于k个数,后来输出...

2020-01-20 20:42:50 148 1

原创 Codeforces 71A Way Too Long Words

Codeforces 71A Way Too Long Words题目链接原题链接题目描述首先输入要求输入的字符数n,接着依次输入n个长度为1~100的字符,倘若输入字符长度小于等于10,按照原字符输出,若超过10则输出首字母+中间字符长度+尾字母问题解法我的思路本题对于博主有两个难点如何储存n个字符如何将超出10个字符的字符中的数字与首尾字符拼接起来对于难点一窝采取了字符...

2020-01-20 18:36:27 179

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除