自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 Introduction to Linear Algebra, Chapter-2, Solving Linear Equations, Key Notes

Introduction to Linear Algebra, Chapter-2, Solving Linear Equations, Key Notes本人在阅读MIT数学教授Gilbert Strang所著线性代数教材"Introduction to Linear Algebra(Fifth Edition)"过程中敲下的笔记我是用的教学视频是BV1uK4y187ep课后习题答案及其它相关资料可参照math.mit.edu/linearalgebra2.1 Vectors and Linear

2020-10-26 20:00:50 884 1

原创 Introduction to Linear Algebra, Chapter-1, Introduction to Vectors, Key Notes

Introduction to Linear Algebra, Chapter1 Key Notes本人在阅读MIT数学教授Gilbert Strang所著线性代数教材"Introduction to Linear Algebra(Fifth Edition)"过程中敲下的笔记我是用的教学视频是BV1uK4y187ep课后习题答案即其相关资料可参照math.mit.edu/linearalgebra1.1 Vectors and Linear CombinationsColumn Vector(列

2020-10-08 00:31:45 607

原创 【Python】机器学习笔记11-核密度估计(Kernel Density Estimation)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltimport cartopy.crs as ccrsimport cartopy.feature as cfeaturefrom cartopy.mpl.geoaxes import

2020-08-17 02:35:43 11188 5

原创 【Python】机器学习笔记10-高斯混合模型(Gaussian Mixture Model)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom matplotlib.patches import Ellipsefrom sklearn.datasets import make_blobs, make_moons, lo

2020-08-17 02:32:37 6861 1

原创 【Python】机器学习笔记09-K-means

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom datetime import datetimefrom sklearn.datasets import make_blobs, make_moons, load_samp

2020-08-17 02:27:44 226

原创 【Python】机器学习笔记08-流形学习(Manifold Learning)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport osimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom matplotlib import offsetboxfrom mpl_toolkits import mplot3dfrom matplotlib.im

2020-08-17 02:24:25 2268

原创 【Python】机器学习笔记07-主成分分析(Principle Component Analysis)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom sklearn.datasets import load_digits, fetch_lfw_peoplefrom sklearn.decomposition import P

2020-08-17 02:16:47 545

原创 【Python】机器学习笔记06-随机森林(Random Forest)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom sklearn.base import ClassifierMixinfrom sklearn.tree import DecisionTreeClassifierfrom

2020-08-17 02:05:54 606

原创 【Python】机器学习笔记05-支持向量机(Support Vector Machine)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom sklearn.pipeline import make_pipelinefrom sklearn.metrics import classification_report,

2020-08-17 02:02:44 476

原创 【Python】机器学习笔记04-线性回归(Linear Regression)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegression, Ridge, Lassofrom sklearn.preprocessing imp

2020-08-17 01:54:56 977

原创 【Python】机器学习笔记03-朴素贝叶斯(Naive Bays)

本文的参考资料:《Python数据科学手册》;本文的源代上传到了Gitee上;本文用到的包:%matplotlib inlineimport pandas as pdimport seaborn as snsfrom matplotlib.pylab import *from sklearn.naive_bayes import GaussianNB, MultinomialNBfrom sklearn.datasets import make_blobs, fetch_20newsgr

2020-08-17 01:52:32 483

原创 【Python】机器学习笔记02:模型评估与特征工程

本文的参考资料:《Python数据科学手册》;本文需要用到的Python包:%matplotlib inlineimport pandas as pdimport seaborn as snsfrom matplotlib.pylab import *from sklearn.neighbors import KNeighborsClassifierfrom sklearn.linear_model import LinearRegressionfrom sklearn.preproces

2020-08-11 21:24:35 420

原创 【Python】机器学习笔记01:scikit-learn简介

机器学习机器学习可以分为有监督的学习和无监督的学习,有监督的学习指的是在数据的若干特征和对应的标签之间的关系,根据标签是离散值还是连续值,有监督的学习可以进一步被分为分类任务与回归任务;无监督的学习是对不带任何标签的数据进行建模,是一种“让数据自己介绍自己”的过程,无监督的学习可以被进一步分为聚类与降维任务,聚类算法可以自动将数据分为不同的组别,降维算法可以让我们用更少的特征来表示数据;如果要使用Python进行机器学习,最常用的包是scikit-learn,这个包中集成了许多经典的机器学习算法和常用

2020-08-11 17:24:06 599

原创 【Python】Matplotlib基本用法(学习笔记)——参考《Python数据科学手册》

【Python】Matplotlib基本用法(学习笔记)——参考《Python数据科学手册》本文的参考资料:O’reilly出版的《Python数据科学手册》,该书在Github上开源,采用jupyter notebook编写。Matplotlib官网:https://matplotlib.org/Matplotlib画廊:https://matplotlib.org/gallery/index.html以下使用MPL作为matplotlib的简称。常用技巧常用的Matplotlib导入方式i

2020-08-01 03:11:27 1033

原创 【Python】大数据挖掘课程作业3——使用朴素贝叶斯分类对B站评论进行分析

【Python】使用朴素贝叶斯分类对B站评论进行分析参考资料:《Python数据科学手册》数据来源:B站观察者网、观视频工作室、央视新闻、小央视频、环球网、环球时报2020年1月到5月所有与新冠疫情相关的投稿视频的弹幕与评论,爬取视频共计13902个,爬取弹幕共计825869条,爬取评论共计16901540条。算法的选择朴素贝叶斯分类是一种常用的有监督机器学习算法,我使用的是scikit-learn提供的朴素贝叶斯分类模型,sklearn提供两种朴素贝叶斯分类,一种是高斯朴素贝叶斯,一种是多项式朴

2020-06-21 23:46:16 1659 1

原创 【Python】大数据挖掘课程作业2——使用SQLAlchemy将爬虫获得的数据储存进数据库

【Python】大数据挖掘课程作业2——使用SQLAlchemy将爬虫获得的数据储存进数据库上一篇博客中,我们详解了从B站爬取相关数据的流程,现在,我们要将数据储存进数据库中。本文写作于2020-06,B站正处于AV向BV过渡的阶段,日后B站后台的数据库设计可能发生变化导致本文的内容不在适用,请读者注意。数据表的定义根据我的课程作业的需要,将定义四个数据表,分别表示UP主、视频、评论、弹幕。定义表单的代码from sqlalchemy import create_engine, MetaData

2020-06-21 22:16:25 430

原创 【Python】大数据挖掘课程作业1——使用爬虫爬取B站评论、弹幕与UP主的投稿视频列表

【Python】大数据挖掘课程作业1——使用爬虫爬取B站评论、弹幕与UP主的投稿视频列表数据挖掘部分的基本目标是:对于指定的UP主,能够获取其投稿视频列表;对于指定的视频,能够获取其视频标签、评论(包括评论下的回复)、弹幕。文章默认读者对网络爬虫有一定的基础知识;文章写作时(2020-06),B站正处于AV号像BV号过度的时期,部分API可能会在今后发生重大变化,请今后的读者注意。获取指定UP主的投稿视频列表首先,我们知道每一个B站帐号都有一个对应的数字UID,然后,通过在浏览器中访问用户的个人主

2020-06-21 17:53:40 5583

原创 【Python】《Python网络爬虫权威指南》第三章任务:验证六度分隔理论

【Python】《Python网络爬虫权威指南》第三章任务:验证六度分隔理论任务描述是否能够通过一个wiki页面上的站内链接,经过最多六次跳转,到达另一个wiki页面,对于本书,我们的任务是从https://en.wikipedia.org/wiki/Eric_Idle跳转到https://en.wikipedia.org/wiki/Kevin_Bacon。完成思路书上都写了,不讲了过程...

2020-04-27 04:15:16 438 2

原创 【Python】使用Python根据BV号爬取对应B站视频下的所有评论(包括评论下的回复)

【Pyton】使用Python根据BV号爬取对应B站视频下的所有评论(包括评论下的回复)本文写于2020-4-27,当你阅读到本文的时候如果因为下列原因导致本文代码无法正常工作,本人概不负责。B站的页面和API接口的变动B站为页面和API加入了反爬虫机制,或者对请求首部有了新的要求Python版本的变动和标准库的调整BeautifulSoup4的变动使用到的库【第三方库】:Be...

2020-04-27 03:52:02 4999 5

原创 【课堂笔记】《数据库系统概论(第5版)》-第11章:并发控制

第11章:并发控制允许多个用户同时使用同一个数据库的数据库系统称为多用户数据库系统;多种事务的执行方式:串行执行一次只运行一个事务,当前事务结束之后才可以运行下一个事务;无法充分利用系统资源;交叉并发方式在单处理机系统中,事务的并行执行是这些并行事务的并行操作轮流交叉运行;单处理机系统中的并行事务并没有真正地并行运行,但能够减少处理机的空闲时间,提高系统的效率;同时并...

2019-05-25 18:34:08 912

原创 【课堂笔记】《数据库系统概论(第5版)》-第10章:数据库恢复技术

第10章:数据库恢复技术10.1 事务的基本概念事务的定义用户定义的一个数据库操作序列,其中的操作要么全做、要么全不做,是一个不可分割的工作单位;一般来讲,一个程序中包含多个事务;与事务有关的SQL语句主要有三条:begin transaction;commit;rollback;commit表示提交事务的所有操作,即将事务对数据库的更新写到磁盘上;rollback表示事...

2019-05-25 18:32:05 869

原创 【课堂笔记】《数据库系统概论(第5版)》-第9章:关系查询处理和查询优化

第9章:关系查询处理和查询优化本章介绍查询处理和查询优化;查询优化一般可以分为代数优化(逻辑优化)和物理优化;9.1 关系数据库系统的查询处理查询处理的任务是把用户提交的查询语句转化为高效的查询执行计划;9.1.1 查询处理的步骤关系数据库管理系统的查询处理可以分为四个阶段:查询分析查询检查查询优化查询执行查询分析对查询语句进行扫描、词法分析、语法分析;从查询语句...

2019-05-14 21:47:34 1462

原创 【课堂笔记】《数据库系统概论(第5版)》-第8章:数据库编程

第8章:数据库编程SQL缺少流程控制能力,难以实现业务应用中的逻辑控制;SQL编程技术可以有效地克服SQL语言实现复杂应用方面的不足,提高应用系统和数据库管理系统之间的互操作性。使用SQL编程来访问和管理数据库中数据的方式主要有:嵌入式SQL(ESQL),过程化SQL(PL/SQL),储存过程和自定义函数,开放数据库连接(ODBC)等。。。8.1 嵌入式SQLSQL的特点之一就是可以在交互...

2019-05-12 21:09:42 2927 1

原创 【课堂笔记】《数据库系统概论(第5版)》-第7章:数据库设计

7.1 数据库设计概述在数据库领域内,通常把使用数据库的各类信息系统都称为数据库应用系统。广义的讲,数据库设计是数据库及其应用系统的设计;狭义的讲,数据库设计是设计数据库本身,即:设计数据库的各级模式并建立数据库。数据库设计的一般定义:对于一个给定的应用环境,构造优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,并据此建立数据库及其应用系统,使之能够有效的储存和管理数据,满足...

2019-04-24 23:17:24 2740

原创 【课堂笔记】《数据库系统概论(第5版)》-第6章:关系数据理论

6.1 问题的提出针对一个具体的问题,应该如何构造一个适合于他的数据库模式,即应该构造几个关系模式,每个关系有哪几个属性组成等。由此形成了关系数据库的规范化理论。一个关系模式应当是一个五元组:R(U,D,DOM,F) R(U, D, DOM, F) R(U,D,DOM,F)R是关系名,是符号化的元组语义U为一组属性D为属性组U中的属性所来自的域DOM为属性到域的映射F为属性组U...

2019-04-11 16:49:28 1618 1

原创 【Python】使用Python在win10下将PDF转化为图片

需要安装的Python模块pip install wandpip install pypdf2需要额外安装的软件ImageMagick:地址GhostScript:地址注意下载与自己的Python解释器和系统对应的版本(32位或者64位)示例代码import iofrom wand.image import Imagefrom wand.color import Colo...

2019-04-10 22:06:28 1594

原创 【课堂笔记】《数据库系统概论(第5版)》-第5章:数据库完整性

数据库完整性数据库的完整性是指数据的正确性和相容性。数据库管理系统必须提供以下功能:提供定义完整性约束条件的机制。提供完整性检查的方法。进行违约处理。5.1 实体完整性5.1.1 定义实体完整性关系模型的实体完整性在create table中用primary key定义。对于单一属性构成的码,可以定义为列级约束条件或者表级约束条件;对于多个属性构成的码,只能采用表级定义(详...

2019-03-29 22:06:58 1231

原创 【课堂笔记】《数据库系统概论(第5版)》-第4章:数据库安全性

数据库安全性4.1数据库安全性概述数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、破坏、更改。数据库系统中大量数据集中存放,而且为众多终端用户直接共享,从而使安全问题更为突出。4.1.1 数据库的不安全因素非授权用户对数据库的恶意存取和破坏。数据库管系统提供的安全措施主要包括用户身份鉴别、存取款控制和视图技术。数据库中重要或敏感的数据被泄露数据库管理系统提供...

2019-03-29 08:39:29 1455

原创 【课堂笔记】《数据库系统概论(第5版)》-第3章:关系数据库标准语言

关系数据库标准语言(SQL)Structural Query Language.3.1:SQL概述3.1.1:SQL的产生与发展概括:nb!3.1.2:SQL的特点综合统一:SQL集数据定义语言、数据操纵语言、数据控制语言的功能于一体,语言风格统一,可以独立完成数据库生命周期中的全部活动,包括以下一系列操作和要求:定义、修改、删除关系模式,定义、删除视图,插入数据,建立数据库...

2019-03-23 21:49:51 1201

原创 【读书笔记】《算法竞赛进阶指南》读书笔记——0x10基本数据结构

to do(perhaps never)CH1401 后缀数组所有课后题栈例题:HDU4699 Editor维护一个整数序列的编辑器,支持以下五种操作:I x:在当前光标位置处插入一个整数x,插入后光标移动到x之后D:删除光标之前的一个元素,相当于按下退格键L:光标左移一个位置,相当于按下左方向键R:光标右移一个位置,相当于按下右方向键Q k:在位置k之前最大的前缀和,k不...

2019-03-08 20:19:57 1513

原创 【课堂笔记】《数据库系统概论(第5版)》-第2章:关系数据库

第2章:关系数据库2.1 关系数据结构及形式化定义按照数据模型的三个要素,关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。2.1.1 关系关系模型的数据结构虽然简单却能够表达丰富的语义,描述出现实世界的实体以及实体之间的各种联系。也就是说,在关系模型中,现实世界的实体以及实体间的各种联系均用单一的数据结构,即关系来表示。关系模型是建立在集合代数的基础上的这里从集合论的角度...

2019-03-06 12:11:28 1714

原创 【课堂笔记】《数据库系统概论(第5版)》-第1章:绪论

写在前面本学期我专业开了“数据库系统概论”这门课,之前就从别人那里听说这门课概念很多,较为无聊,有很多人建议我这门课还是应该尽早开始背;在拿到课本之后我大致翻阅了一下,发现这本书确实文本量较大、概念较多,但同时作为一门专业基础课,确实也有好好学习,或者至少详细看一遍课本的必要,于是我决定对这一门课做一个详细的笔记,以来为了更好的学习这门课程,二来课上找点事情做,不然会睡着的。刚开始的时候,我打...

2019-03-06 12:09:57 2343

原创 【读书笔记】《算法竞赛进阶指南》读书笔记——0x00基本算法

to-do:例题: POJ 1845 Sumdiv所有的课后习题;随缘~~~位运算对于一个二进制数,通常称其最低位为第0位,从右往左依此类推。补码unsigned int直接将其看作32位二进制数。signed int以最高位位符号位,0表示非负数,1表示负数;如果最高位为0,直接看做32位二进制数;同时定义该编码按位取反后得到的新编码 C~C C表示...

2019-02-14 01:13:52 1456 1

原创 【读书笔记】《算法竞赛进阶指南》读书笔记——0x40数据结构进阶

并查集(Disjoint-Set)路径压缩:采取路径压缩优化的并查集,每一次查询操作的均摊复杂度为O(logN)O(logN)O(logN)按秩合并:秩一般有两种定义:1. 树的深度(未压缩路径时)2. 集合的大小无论采取哪种定义,都可以把“集合的秩”储存在“代表元素”,也就是树根上,在合并时把秩较小的树根作为秩较大的树根的子节点。值得一提的是,当把“秩”定义为集合的大小时,“按秩合并...

2019-01-11 22:53:56 1311

原创 【题解+代码】HDU6223 Infinite Fraction Path

Infinite Fraction Path优先队列BFS + 剪枝思路都在注释里参考题解 CSDN题目链接// reference: https://www.cnblogs.com/stranger-/p/7841085.html// BFS + 剪枝,略抽象#include <bits/stdc++.h>#define MAX 150005using na...

2018-12-30 01:41:00 958

原创 【题解+代码】 HDU1401 Solitaire

I: Solitaire HDU1401双向BFS,HASH记录状态代码都写了注释,可读性应该还行写的有点长,有点挫题目链接#include <bits/stdc++.h>using namespace std;int dir[4][2] // 移动的方向 { { 1, 0 }, { ...

2018-12-30 01:38:40 1196

原创 浅谈C/C++的编译过程——源码如何变成可执行文件

相信很多人同我一样,在刚刚接触C语言的时候,只是找了一本教材,或者是找了一套教学视频,跟着慢慢学习C语言的语法,并没有去多想一个.c文件在后台究竟是经过了怎样的步骤才最终变成.exe文件;就在前几天,本人闲着无聊翻开了在书架上吃灰将近一年的“全新”CSAPP,在看到其第一章的内容之后,恍然大悟,姑且水一篇博客纪念一下。 首先我们来简要看一下CSAPP原书上的内容:(这是我按照自己的理解结合...

2018-11-01 22:52:40 5641

原创 win10下利用cmake和vs重新编译opencv源码

最近本人在啃《学习OpenCV3》这本书,在“跨平台与Windows系统”这一章节中,书上提到编译OpenCV时,在cmake选项中,勾选WITH_QT则可以使用基于Qt的GUI模块,相比OpenCV自带的highgui功能更强;但在我实际操作之后,发现有关如何使用win10 + visual studio 2017 + cmake实现上述操作的文章很少,而且不少还存在错误,在经历了一天的折腾终于...

2018-10-20 02:10:00 6335 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除