自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (13)
  • 收藏
  • 关注

原创 Windows 电源计划设置关闭显示器不起作用的解决方法

在Windows 电源选项设置电源计划的“关闭显示器”触发时间后,发现到达指定无操作时间后并不生效。这可能是Windows系统不稳定缺陷导致。

2022-01-22 22:00:44 12191 4

原创 dummies、factorize进行one-hot编码的区别

在机器学习的分类任务中,经常存在一个特征有多个分类变量值,需要对离散型数据进行one-hot编码处理。one-hot 常见的处理方法有两种:pandas:使用pandas库中的函数pd.dummies()或pd.factorize()进行one-hot编码;sklearn:使用sklearn库中的OneHotEncoder()方法进行one-hot编码。get_dummies()与factorize()的区别:1. dummy()映射后生成多个特征。使用pd.get_dummies

2021-11-26 23:48:07 677 2

原创 Linux 中后台指定使用某一GPU运行代码

Linux 中后台指定使用某一GPU运行代码:$ CUDA_VISIBLE_DEVICES=0 nohup python -u train.py > log1.file 2>&1 &程序执行时运行方法如上。CUDA_VISIBLE_DEVICES=0 即使用0号GPU。有关nohup的使用方法和介绍,参照我的另一篇博客:nohup命令: Linux后台运行程序并实时查看输出_威廉软件的博客-CSDN博客_nohup实时输出可以使用以下命令查看GPU序列号

2021-11-25 22:13:45 1764

原创 conda常用命令汇总,随时查询(最全)

Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。在Windows下,需要安装使用Anaconda Prompt ;在Linux下,可以直接执行conda命令。1.创建一个新环境conda create -n your_env_name python=X.X # 或conda create --name your_env_name python=X.X-n即--name,your_env_name是你自定义的环境名称.

2021-11-24 11:46:19 26060 2

原创 解决 ERROR: Could not find a version that satisfies the requirement 的一种思路

出现这个问题的原因竟是国内网络不稳定,直接导致报错,而不是环境冲突。

2021-11-23 21:43:57 10651 1

原创 wsappx占用大量CPU,关闭Windows10的wsappx服务

在Windows10开机完成后,wsappx服务会自动启动并在一段时间内占用大量CPU、内存和磁盘,导致笔记本电脑风扇声音大,带来令人不愉快的噪声。

2021-11-22 14:00:18 23522 7

原创 Python基础:增加和去除数字的千位分隔符

千位分隔符,其实就是数字中的逗号。依西方的习惯,人们在数字中加进一个符号,以免因数字位数太多而难以看出它的值。所以人们在数字中,每隔三位数加进一个逗号,也就是千位分隔符,以便更加容易认出数值。处理财务数据时,经常会和千分位符号打交道。经常看数字时,如果位数很多,往往要一位位的数,才知道具体的金额。如果有千分位符,那么一眼就知道金额的具体大小。目前千分位符在手机银行和计算器中较常见。现编写2个函数,1个函数输入带千分位符的字符串(带千分位符就不再是数字了)输出数字,另1个函数输入数字(如果数字是小数则

2021-10-10 15:23:25 13252 2

原创 Python 认识if-else写在一行等简洁写法

Python 有着并不十分苛刻严谨的语法要求,如常用的if-else语句块,就有多种简洁的写法。对于简单的if-else判断,可以在一行上完成表达。我们需要认识这些写法,在阅读别人的代码时,才会有清楚的认识。如下看到的是最普通的if-else 的写法,看似简单的代码,却也占据了4行。if a>b: c = aelse: c = b观察这段if-else语句,为“真”时把a赋值给c,为“假”时把b赋值给c,可见都是对c赋值。一种简洁的表达是,判断为“真”的语句(即

2021-09-15 22:01:58 6104 1

原创 机器学习:线性回归模型的评价方法 MSE, MAE, R2

MSE、RMSE、MAE思路:测试数据集中的点,距离模型的平均距离越小,该模型越精确。使用平均距离,而不是所有测试样本的距离和,因为距离和受样本数量的影响。

2021-09-13 22:12:13 6922

原创 Python matplotlib.pyplot库简要学习

Pyplot 是 Matplotlib 的子库,提供了和 MATLAB 类似的绘图 API。Pyplot 是常用的绘图模块,能很方便让用户绘制 2D 图表。Pyplot 包含一系列绘图函数的相关函数,每个函数会对当前的图像进行一些修改,例如:给图像加上标记,生新的图像,在图像中产生新的绘图区域等等。使用的时候,我们可以使用 import 导入 pyplot 库,并设置一个别名plt。往往需要把numpy也导入进来。importmatplotlib.pyplotaspltimport nu...

2021-09-13 15:46:36 4145 2

原创 Python Pandas库简要学习

一、Pandas 简述Pandas 是 Python 语言的一个扩展程序库,用于数据分析。它并不是熊猫胖达的复数,它的名字衍生自术语 "panel data"和 "Python data analysis"。Pandas 是一个强大的分析结构化数据的工具集,基础是Numpy(提供高性能的矩阵运算)。Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。Panda..

2021-09-12 20:26:53 4742

原创 Python利用demoji库删除文档中的表情符号

在进行数据清洗时,往往需要删除文档中的出现的表情符号,因为他们无法被读取。借助demoji库,可以非常简单地完成这项工作。关于demoji 库的文档,可以访问demoji · PyPI首先,需要在环境中利用pip install安装demoji库。pip install demoji实现删除文档中的表情符号的代码如下:# -*- coding: UTF-8 -*-import osimport demoji file_path = "SeptemberB.txt" /*

2021-09-12 16:57:39 1338 2

原创 sklearn CountVectorizer中的min_df和max_df的含义

vectorizer = CountVectorizer(min_df = 1, stop_words=stopwords)CountVectorizer是属于常见的特征数值计算类,是一个文本特征提取方法。对于每一个训练文本,它只考虑每种词汇在该训练文本中出现的频率。CountVectorizer会将文本中的词语转换为词频矩阵,计算各个词语出现的次数。CountVectorizer可指定的参数包含min_df、max_df、stop_words等。下面讲经常调节的min_df、max_df参...

2021-09-12 15:16:23 2828

原创 Python实现在txt文件中随机抽取指定数量的行

在数据处理中,有时需要从一个大的txt文件中随机抽取指定数量的行来做样本。如在处理不平衡数据集时,可以从较大的数据集中随机抽取一些数据来做样本。下面用Python实现这一需求,可指定抽取范围和抽取数量,只需要更改参数。编码为utf-8。# -*- coding:utf-8 -*-#在txt文件中随机抽取行import randomfrom random import randint oldf = open('dataset.txt', 'r',encoding='utf-8')

2021-09-05 21:47:26 6373

原创 Python实现大文本文件分割成多个小文件

参考百度搜索出来的各种文本切割实用软件,往往不支持多文件或切割速度较慢,无法满足自定义的需求。Python编程语言可以实现实现大文本文件分割成多个小文件。一、按照大小分割,例如大文件分割成每80KB一个小文件。Python 代码实现:# -*- coding: utf-8 -*-#按照大小分割文件import osfilename = "n (2).txt"#需要进行分割的文件,请修改文件名size = 80000 #分割大小约80Kdef mk_SubFile(srcN

2021-09-03 21:51:18 9789 2

原创 nohup命令: Linux后台运行程序并实时查看输出

nohup python -u train.py > log.file 2>&1 &注释:nohup (no hang up),不挂起。python train.py是原本运行程序的命令.-u (unbuffered,不缓存)这个参数加在python的后面,可以实时查看输出,而不用等把一段日志文件写入log.file后才能查看。>log.file 注意有>号,是将command的输出重定向到out.file文件,即输出内容不打印到屏幕上,而是...

2021-08-27 12:41:54 7363

原创 在Windows 记事本中快速选中大量文本的方法

以下以Notepad3为例,在Windows 记事本和几乎所有的文本编辑软件中有相同的操作方法。1. 基本操作:全选,快捷键为Ctrl + A。跳转到指定行或列,快捷键为Ctrl + G。间断复选:Ctrl+左键。按住ctrl键不放,单击并拖动要选的文字。2. 选中一个包含大量行的片段(连续选择):光标定位在片段起始或末尾位置,鼠标滚动找到欲选择片段的末尾或起始位置,在该位置同时按住Shift键并点击鼠标左键,这样可以选择整个片段。即在某处放置光标,在另一处Shif.

2021-08-20 21:43:12 21370

原创 机器学习入门学习第二章:线性回归模型(吴恩达)

1.模型描述——线性回归模型模型举例——房价预测:监督学习、回归问题。2.一些符号表示:m 训练样本training example的数量(x,y) 表示一个训练样本(x^(i),y^(i)) 表示第i个训练样本如下数据:x^(1) = 2104, y^(1) = 460学习算法的任务是输出一个函数function,用小写字母h 表示h代表假设函数hypothesis。线性关系:注:简写h(x)上面是一个一元线性回归/单变量线性回归。...

2021-08-03 00:55:21 137

原创 机器学习入门学习第一章(吴恩达)

1.什么是机器学习?两大类:监督学习Supervised和无监督学习Unsupervised其他热词:强化学习(reinforcement) 、推荐系统2.什么是监督学习?我们给算法一个数据集,其中包含了正确答案(下图中每一个X都对应纵轴有数值对应,即正确答案)。算法的目的就是给出更多的正确答案。例如给750size的房子计算出估价。——例子1:回归Regression问题:回归是指我们的目标,想要预测predict连续的continuous数值输出。应用:房价预测。

2021-08-03 00:51:13 413

原创 PyTorch简要学习(李宏毅机器学习2021春)

1.什么是PyTorch?2.与TensorFlow对比3.Overview of the DNN Training ProcedureDNN训练程序概述4.什么是Tensor?Tensor,张量。一个高维度的矩阵。就像NumPy的Array.5.Tensor里面存什么东西呢?最常见,存浮点数、整数。6.Tensor的形状7.如何产生一个Tensor?8.常见的运算(1)Squeeze(2)Unsqueeze(3) Tr

2021-08-01 23:21:56 425

原创 Python append方法浅拷贝机制代码示例解析

Python中的append方法是一个常用的方法,可以将一个对象添加到列表末尾。例如:list = [1,2,3]list.append(4)# 得到的新的列表就变成了[1,2,3,4]考虑这样一段代码,a = [1,2]b = []b.append(a)print(b)a.append(0)print(b)他的执行效果如下,明明两次打印之间并没有对b操作,那么为什么b会发生改变呢?[[1, 2]][[1, 2, 0]]原来,append方法是浅拷贝。在

2021-07-30 23:10:05 584 2

原创 NumPy库的简要入门学习

NumPy(Numerical Python) 是使用Python进行科学计算的基础软件包。支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。numpy.array()numpy为我们提供了一个特殊的数组对象, 用它表示一维数组、二维矩阵等。numpy提升了Python中数据计算的速度,比python快,因为底层是C。对于任何想要运算的数据,需要预先将他们表示成numpy数组的形式。——即向量化(Vectorization)一、创建数组nump

2021-07-30 22:29:02 348 1

原创 JSON文件操作:合并多个JSON文件,提取JSON中某一字段

1.合并多个JSON文件将./source文件夹下的多个json文件合并为一个json文件存放于./merge/merge.json#将./source文件夹下多个json文件合并为一个json文件./merge/merge.jsonimport osimport jsonimport tqdmdef merge_json(path_results, path_merges): merges_file = os.path.join(path_merges, "merge.json

2021-03-15 15:57:32 2990 2

原创 数据结构:折半查找判定树及查找成功与不成功的平均查找长度

2020-10-27 17:50:30 17490 7

原创 什么是机器学习、深度学习、图神经网络?

人工智能是追求目标,机器学习是实现手段,深度学习是其中一种方法。1 机器学习机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。1.1 机器学...

2020-10-08 23:00:46 6598 1

原创 数据结构C语言版:清华版代码合集1:队列、线性表

数据结构清华版C++代码合集(1)队列_顺序队列队列_顺序循环队列队列_链队列队列_循环队列线性表应用_集合操作1线性表应用_集合操作2线性表应用_一元多项式线性表_顺序表线性表_顺序表(数组)线性表_链表线性表_循环链表线性表_双向链表线性表_单链表队列_顺序队列#include<stdio.h>#include<stdlib.h>#define MaxSize 50#define ElemType int#define Status inttypedef struc

2020-10-06 11:49:18 215

原创 数据结构C语言版:链式基数排序(课本)

分配类排序不需要比较关键字的大小,它是根据关键字中各位的值,通过对待排序记录进行若干趟 “ 分配 ” 与 “ 收集” 来实现排序的,是一种借助于多关键字排序的思想对单关键字排序的方法。基数排序(Radix Sorting)是典型的分配类排序。*以上内容来自《数据结构(C语言版)(第2版)》人民邮电出版社...

2020-10-06 11:33:08 956

原创 图神经网络文章推荐

1. GCAN: Graph-aware Co-Attention Networks for Explainable Fake News Detection on Social Media论文:https://arxiv.org/pdf/2004.11648.pdf代码:https://github.com/l852888/GCAN论文解析:https://blog.csdn.net/qq_27590277/article/details/1081627402. He...

2020-10-03 15:01:42 422

原创 图神经网络之针对短文本分类的异质图注意力网络 - 让代码跑起来

本文介绍如何运行图神经网络类论文的代码。《EMNLP 2019开源论文:针对短文本分类的异质图注意力网络》论文介绍:https://mp.weixin.qq.com/s/eCmvUaM4Vg5KCFQJcRO-TQ论文地址:https://www.paperweekly.site/papers/3211GitHub代码地址:https://github.com/ytc272098215/HGAT一、需要的环境:Anaconda3 (Python 3.6或3.7)、Pytorch.

2020-10-03 14:53:59 1758 3

原创 前端入门学习笔记01:HTML标签(上)

一、简单认识HTML1.HTML 指的是超文本标记语言 (多媒体内容超越了文本限制,还有超链接文本) ,它是用来描述网页的一种语言。HTML 不是一种编程语言,而是一种标记语言。标记语言是一套标记标签。2..Web 标准的构成:主要包括结构 、表现和行为三个方面。结构、样式、行为相分离。 结构写到 HTML 文件中, 表现写到 CSS 文件中, 行为写到 JavaScript 文件中。二、HTML标签1.如 <html> </html> 双标签如...

2020-09-27 22:22:42 258

原创 数据结构C语言版:利用栈将中缀表达式转为后缀表达式,进行四则运算求值

《数据结构》给出这样一道题目:借助辅助栈,编写算法,计算一个后缀表示式T的值。题目减少了将中缀表达式转换为后缀表达式的算法步骤。事实上,要实现四则运算求值,需要把中缀表达式转化为后缀表达式,再把后缀表达式进行运算得出结果。一、中缀表达式与后缀表达式1. 观察式子:1+2平时我们所用的四则运算表达式都是运算符在两个数字中间的,所以称这种表达式为中缀表达式。它需要判断括号匹配,需要判断加减乘除的优先级。2. 观察式子:1 2 +运算符在两个数字之后的表达式为后缀表达式。如果.

2020-09-26 21:37:27 5711

原创 广工新Anyview数据结构第一章解答

DC01PE06【题目】试写一算法,如果三个整数a,b和c的值不是依次非递增的,则通过交换,令其为非递增。要求实现下列函数:void Descend(int &a, int &b, int &c);/* 通过交换,令 a >= b >= c */void Descend(int &a, int &b, int &c) { // 通过交换,令 a >= b >= c int temp; if(a<.

2020-09-21 23:33:23 2009 1

原创 Python语言程序设计 嵩天MOOC全课时学习笔记(讲义截图)

建议在手机上阅读,本文仅为个人学习记录用。1.代码的注释#注释'''注释第一句注释最后一句'''2.数据类型注意:[1:3]表示第1个字符、第2个字符,但不包括第3个字符。字符串中有可能既有双引号又有单引号,例如:字符串:demo'1'。这时候就可以:str  = "demo'1'";这样看更直观,当然也可以使用转义字符\'代替单引号:str  = 'demo\'1\''。字符串:demo"1"。这时候就可以:str  = 'demo...

2020-08-20 23:06:00 801

原创 Python中列表、元组、字典和集合的区别以及他们的转换

前排提示:元祖是错误的写法(带错别字),部分博客写为元祖系误,正确的说法为元组。首先了解序列。序列是具有先后关系的一组元素,它是一维元素向量,元素类型可以不同。元素间由序号引导,通过下标访问序列的特定元素。序列是一个基类类型,元组、列表是序列类型的一种扩展,继承序列类型的全部通用操作。(1)集合set集合就是我们数学学的集合,集合最好的应用是去重——集合类型所有元素无重复。可以利用{}或set()建立集合。注:print默认以换行符\n作为结尾,end=" "则使prin

2020-08-14 22:04:34 5216 1

Java管理系统收集项目案例5个_Java

使用Java开发的管理系统项目案例,部分项目界面使用swing,部分项目界面使用JavaFX。包含图书馆管理系统、学生信息管理系统等。

2020-05-01

安卓音乐播放器收集项目案例11个_Android

收集一些安卓音乐播放器项目开发代码和案例,可供学习参考,共11个。多数为基础应用,难度较低。支持本地播放。

2020-05-01

安卓音乐播放器本地播放_Android Studio项目

基于Android Studio SDK29开发,兼容安卓Q,UI优美,功能完整,可测试或再开发,包含全部项目文件。支持的功能:基本音频播放与控制、收藏喜爱的音乐、显示播放列表、设置播放模式、定时关闭播放、在通知栏显示通知。

2020-04-30

二叉树ADT及其前缀计算器应用_C语言项目

二叉树ADT:构造树、摧毁树、递归遍历——前序遍历、中序遍历、后序遍历、层次遍历;应用:利用二叉树求前缀表达式的值,前缀表达式计算器。项目包含可执行文件测试,包含PPT.

2020-04-27

数据排序算法和测试_C语言项目

1. 排序函数:插入排序、归并排序、快速排序(递归、不递归、枢轴存放)、计数排序、基数计数排序。 2. 应用题:颜色排序、在一个无序序列中找到第K大/小的数。 3. 测试程序:数据生成、普通测试、读文件测试、写结果文件。 所有程序包含实现的测试,含指导PPT。

2020-04-19

顺序存储和链式存储的泛型队列_C语言项目

队列是限定仅在表尾进行插入,在表头进行删除操作的线性表。包括:初始化、判空、判满、入队、出队、得到队头元素、队列长度、清空、销毁、遍历。修正了一些问题。

2020-04-12

Java基础重要知识点学习导览

读者可以参考本文档的要求有的放矢地学习,短时间内学到更核心的知识。本文档提供Java基础知识点导览,但不提供详细内容,可以作为一个很好的学习目录和学习内容指引。

2020-04-12

四则运算计算器V3_C语言项目

功能得到了极大的提高!支持括号、小数、长数字、异常输入规避和判断。修复 V2版本中存在的错误;新增 精确到小数点后两位的浮点计算;新增 输出后缀表达式;优化 输入输出数据范围;优化 在括号内输入单个数字的运算。程序可运行测试和使用。版本号:V3.01

2020-04-11

四则运算计算器V2_C语言项目

支持带括号的运算式,括号必须是英文状态下输入的括号;只支持第一个数为负数的情况;不支持浮点运算。程序可运行测试和使用。

2020-04-05

四则运算计算器V1_C语言项目

完整支持基本四则运算。但仅支持第一个运算数为负数的情况,暂不支持例如2+-3的算术式;不支持浮点运算;暂不支持带有括号的算术式(V2版本已新增支持)。程序可运行测试或使用。

2020-04-05

栈:顺序栈和链表栈_C语言项目

顺序栈和链表栈(链栈)的初始化栈、判断栈是否为空、得到栈顶元素、清空栈、销毁栈、检测栈长度、入栈、出栈。程序可测试。

2020-04-05

单链表双向链表ADT_C语言项目

Singly Linked List: 1. DestroyList 2. InsertList 3. DeleteList 4. TraverseList 5. SearchList 6. ReverseList 7. IsLoopList 8. ReverseEvenList 9. FindMidNode Double Linked List: 1. DestroyList_DuL 2. InsertBeforeList_DuL 3. InsertAfterList_DuL 4. DeleteList_DuL 5. TraverseList_DuL

2020-04-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除