自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 收藏
  • 关注

原创 MacOS:如何给pycharm设置Anaconda里的编译环境

一定要选择Anaconda-Navigator.app/Contents/MacOS文件夹下的文件python,就可以使用在anaconda里下载好的一切工具包了。

2022-02-09 04:12:22 863

原创 python:如何对数组按指定列排序

用到的函数就是sorted(iterable, key=None, reverse=False) ,参数j介绍如下:iterable:就是将要被排序的任何可迭代对象(例如list)key:写一个lambda函数,指定每步迭代将要被作为排序标准的元素reverse:默认为False,即升序排列,若为True则为降序排序极简例子:list1 = [[1,20],[2,3],[1,5]]new_list = sorted(list1, key = lambda x:x[1])print(new

2021-12-06 05:10:50 7383

原创 Numpy库实现矩阵乘法以及元素级乘法

想要实现线性代数中讲过的矩阵乘法,即符合矩阵相乘的两个矩阵需要满足条件:第一个矩阵的列数等于第二个矩阵的行数。使用numpy的库函数:np.matmul。如果参与matmul运算的两个矩阵尺寸不满足上述条件则会报错a = np.array([[1,2,3,4],[5,6,7,8]])a# 显示以下结果:# array([[1, 2, 3, 4],# [5, 6, 7, 8]])a.shape# 显示以下结果:# (2, 4) b = np.array([[1,2,3],[4,5,6.

2021-05-13 22:56:28 2131 2

原创 python学习之——在指定的路径下生成文件夹

import osfor i in range(6, 11): path = "processed_data/Hg/3ms-100per-" + str(i) + "mm-hg" os.mkdir(path + './InputData')上面这段代码实现了,在每一个path路径下生成一个InputData文件夹生成结果如下:

2021-03-30 13:27:00 1168

原创 python学习之——同一个项目目录下,如何在一个文件中访问另一个文件中的变量

直接在需要访问其他文件变量的文件中,调用如下语句:from 变量所在文件名 import 变量名例如,文件InputData.py生成变量input_wave现在想在文件InputCucl2.py中调用input_wave如下

2021-03-29 17:13:41 1285

原创 满秩矩阵与正定矩阵

满秩矩阵设A是n阶矩阵, 若r(A) = n, 则称A为满秩矩阵。但满秩不局限于n阶矩阵。若矩阵秩等于行数,称为行满秩;若矩阵秩等于列数,称为列满秩。既是行满秩又是列满秩则为n阶矩阵即n阶方阵。矩阵的秩:用初等行变换将矩阵A化为阶梯形矩阵, 则矩阵中非零行的个数就定义为这个矩阵的秩, 记为r(A),根据这个定义, 矩阵的秩可以通过初等行变换求得。需要注意的是, 矩阵的阶梯形并不是唯一的, 但是阶梯形中非零行的个数总是一致的。阶梯形矩阵:其特点为:每个阶梯只有一行;元素不全为零的行(非零行)的

2021-03-27 11:18:06 7918

原创 Python学习之——“and”运算符的说明:短路+多个真值时的选择问题

今天在牛客刷到一道奇奇怪怪的算法题,是酱婶的:参考了一下通过的代码,是酱婶的:# -*- coding:utf-8 -*-class Solution: def Sum_Solution(self, n): # write code here return n and (n + self.Sum_Solution(n-1))用到了递归。理解这个答案的关键就在于对and的理解:r“短路原则”:当两个表达式进行and运算时,如果第一个(左边)的表达式结果

2021-03-26 11:02:10 303 1

原创 python学习之——使用range生成逆序排序的list

range(start, end, step)start为逆序list里最大的数值end为逆序list里(最小-1)的数值step为-1示例:

2021-03-07 21:04:44 498

原创 假设检验与P值的理解

假设检验的目标是回答这个问题,“给定一个样本和一个明显的effect,偶然看到这种effect的概率是多少?”第一步:通过选择一个检验统计量(t检验、方差分析等)来量化表观该effect的大小。第二步:定义一个null hypothesis,null hypothesis是一个基于假设 “该effect不成立” 的系统模型。第三步:计算p值(p-value)第四步:解释p值的结果P-value的理解p值就是null hypothesis成立的概率。如果这个值很低(一般小于0.05),那么这个

2021-02-22 18:47:42 949

原创 偏态分布

偏态分布分为正偏态分布和负偏态分布。正偏态分布正偏态分布是相对正态分布而言的。当用累加次数曲线法检验数据是否为正态分布时,若X‾\overline{X}X>Me>Mo时,即平均数(X‾\overline{X}X)大于中数(Me),中数又大于众数(Mo),则数据的分布是属于正偏态分布。正偏态分布的特征是曲线的最高点偏向X轴的左边,位于左半部分的曲线比正态分布的曲线更陡,而右半部分的曲线比较平缓,并且其尾线比起左半部分的曲线更长,无限延伸直到接近X轴。负偏态分布负偏态分布也是相对正态分布

2021-02-22 12:30:28 2887

原创 Pandas的学习之——使用Pandas进行描述性统计

首先引入需要的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pyplot读取数据ratings_url = 'https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBMDeveloperSkillsNetwork-ST0151EN-SkillsNetwork/labs/teachingratings.csv'rating.

2021-02-09 22:30:30 6133

原创 Pandas学习之——使用pandas获取数据以及数据概览

1 数据获取先引入必要的库import pandas as pdimport numpy as np1.1 读取数据使用方法:pandas.read_csv()参数:(1)文件所在的路径(2)headers:设置参数headers=None,pandas将不会自动将数据集的第一行设置为列表表头(列名)other_path = "https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/

2021-02-08 21:51:33 8394

原创 SQL学习之——DM2数据库里的一些关键字

下面得sql查询语句只限在DB2数据库中有效。1 使用“null last”关键字来降序排序来取前10行数据,排除null值查询要求:找出学生出勤率最高的十所学校的名称执行代码:select Name_of_School, Average_Student_Attendance from SCHOOLS order by Average_Student_Attendance desc limit 10查询结果:返回的第一行为空值,并不是我们想要的。改进查询语句:加入关键字

2021-02-03 23:01:51 228

原创 SQL学习之——使用JOIN关键字来进行不同表之间的连接查询

有两种连接方式,inner join和outer join其中outer join又分为三种:left outer joinright outer joinfull outer join下面通过实际例子来理解记录:用到的数据库表格如下:1 选择为部门号为5的所有员工的姓名、工作开始日期和工作头衔。select E.F_NAME,E.L_NAME, JH.START_DATE, J.JOB_TITLE from EMPLOYEES as E INNER JOIN JOB_HIST

2021-02-03 01:08:58 701

原创 SQL学习之——sub-query在多表连结查询中的应用

有三种方式能够在一条sql语句中查询多个表的内容,分别是使用子查询语句sub-queryimplicit JOINJOIN operators:INNER JOIN, OUTER JOIN1 使用sub-query例如下面的sql,用于查询DEP_ID在departments表中的员工信息。这个查询需要用到employees和departments两张表。select * from employees where dep_id in (select dept_id_dep from de

2021-01-27 20:16:16 766

原创 SQL学习之——subqueries子查询

sub-queries可以用在查询语句中的多个位置。1 sub-queries用在where clause中SQL中的聚合函数(如sum(),avg()等)不能用在where子句中。例如,下面的sql语句将会报错:select * from employees where salary > avg(salary)上面sql语句的查询目的是,在employees表中,查找那些薪水高于平均薪水的员工的信息。虽然不可以像上面那样写,但是可以使用sub-queries子查询语句来实现同样的功能。s

2021-01-27 16:19:26 1625

原创 最简单的神经网络内部计算原理理解

最简单的神经网络内部计算原理理解下面使用到的,是一个具有两个输入节点,以及两个输出节点的极简神经网络。层1 是输入节点,这层的节点只是展示输入值的功能,不做其他计算。从输入层到输出层之间总共有四种连接方式(即上面四个绿色箭头),首先,随机初始化这四个连接的权重。权重是神经网络进行学习的内容,这些权重持续进行优化,得到越来越好的结果。对于第二层输出层,这一层的每个节点,都需要计算出组合输入,即原始输入分别乘以相应的权重并相加,得到的组合输入。然后,利用激活函数,例如sigmoid函数:y=11+

2021-01-26 20:48:26 563

原创 SQL学习之——order by

SQL学习之——order by多个排序、count(*)统计总行数、having语句注意事项1 order by可以实现多层排序例:查询需求:查出员工的姓和名以及部门id,部门id降序排序。在同一个部门下,员工根据姓(last name)降序排序。select F_NAME, L_NAME, DEP_ID from EMPLOYEES ORDER by dep_id desc , l_name descorder by 语句后面可以有多个排序条件,前后顺序代表了排序的先后顺序查询结果:

2021-01-24 20:59:19 959

原创 SQL学习之——having关键字

SQL学习之——having关键字注:和where语句的不同之处是,where语句针对的对象是全部的结果集合;而having语句针对的是group by分组以后的各个组别。详见下图示例:

2021-01-21 16:24:09 404

原创 Python学习之——HTTP协议的一些基本概念以及Python库Requests

Python学习之——HTTP协议的一些概念以及Python库Requests1 HTTP的概述1.1 URL:Uniform Resource Locator统一资源定位符1.2 Request:请求1.3 Response:响应2 Python库:Requests2.1 获取带有URL参数的请求2.2 Post请求...

2021-01-16 12:00:00 394

原创 Python学习之——Pandas用法进阶

Python学习之——Pandas用法进阶下面要用到的例子需要提前先安装nba_api!pip install nba_api1. Pandas是一个API1.1 函数one_dict先定义一个函数:将一个内部元素是字典的list(函数的参数)转换为一个字典(输出)。因为后面会用到。参数list中的每个字典元素具有一模一样的结构(key保持一致),最终转换出的结果字典将参数list中的每一个不同的value都统一汇总到相对应的key下面。def one_dict(list_dict):

2021-01-12 12:33:53 480 2

原创 Python学习之——字典对象的items()方法

字典对象的items()方法返回可遍历的(键, 值) 元组数组。dict = {'Google': 'www.google.com', 'Runoob': 'www.runoob.com', 'taobao': 'www.taobao.com'}for key,value in dict.items(): print("key:%s" % key) print("value:%s" % value)输出:key:Googlevalue:www.google.comkey:R

2021-01-11 18:06:55 247

原创 Python学习之——2d Numpy基本用法

Python学习之——2d Numpy基本用法先引入相关的包:import numpy as np import matplotlib.pyplot as plt1. 创建一个2D的Numpy数组将一个list转化为一个Numpy数组a = [[11, 12, 13], [21, 22, 23], [31, 32, 33]]A = np.array(a)A输出:array([[11, 12, 13],[21, 22, 23],[31, 32, 33]])使用ndim属性查

2021-01-11 16:35:55 1479

原创 机器学习算法衡量指标——准确率、精确率(查准率)、召回率(查全率)

机器学习算法衡量指标在分类问题中,将机器学习模型的预测与实际情况进行比对后,结果可以分为四种:TP、TN、FN、FP。每个的第一个字母:T/F,代表预测结果是否符合事实,模型猜得对不对,True or False。 每个的第二个字母:N/P,代表预测的结果,是Negative,还是Positive。因为对于分类问题,机器学习模型只会输出正类和负类两种预测结果。具体来说:结果描述TPTrue Positive,预测结果为正类,且与事实相符,即事实为正类。TNTrue Neg

2021-01-08 23:27:35 3848

原创 机器学习之——“损失函数”与“成本函数”的辨析

机器学习之——“损失函数”与“成本函数”的辨析损失函数与成本函数都表示预测结果与真实情况的偏差。损失函数:是针对单个样本,成本函数:针对整个数据集成本函数是由损失函数计算得到的。不过在实际计算中,可以选择令成本函数为损失函数的总和,也可以令成本函数是损失函数值的平均。无论是总和还是平均,最终目标都是希望最小化成本,从而使假设函数的预测最可靠。...

2021-01-08 17:04:11 1141

原创 Python学习之——1dNumpy基本用法

Python学习之——1dNumpy基本用法引入numpy包import numpy as np1. 简要描述一个numpy数组类似于python中的数据类型list。numpy数组通常具有固定的大小size,数组中的每个元素一定是同种类型的。2. 将list转化为一个numpy数组a = np.array([0, 1, 2, 3, 4])a输出:array([0, 1, 2, 3, 4])和访问list里的元素一样,访问numpy数组也是用同样的方式:print("a[0]:

2021-01-06 17:38:19 1554

原创 正态分布以及推测统计简述

正态分布及推测统计简述在概率密度函数中,最常出现且最重要得一种,是呈正态分布的概率密度函数。大致来说,“呈现带有误差现象的数据大多可用正态分布来表示”1 . 正态分布的概率密度函数当随机变数X满足上式所代表的概率密度函数时,X的平均值为μ,方差为σ2,标准差为σ。X的平均值为μ,方差为\sigma^2,标准差为\sigma。X的平均值为μ,方差为σ2,标准差为σ。平均值为μ,方差为σ2的正态分布表示为N(μ,σ2)。平均值为μ,方差为\sigma^2的正态分布表示为N(μ, \sigma^2)。平

2021-01-06 12:32:29 4541

原创 连续型随机变数与概率密度函数

连续型随机变数的平均值与方差连续型随机变数X取值范围为a<= X <= b,且概率密度函数为f(x)时:注:μ为随机变量的均值推导根据离散型随机变数的均值以及方差的公式,结合概率密度函数的面积为概率等进行如下推导就可以得出连续型随机变数的均值及方差公式概率密度函数描述连续型随机变数X取值范围为a<= X <= b时其概率P(a<= X <= b)为下图所示的面积,即:这时,f(x)被称作X的概率密度函数。性值(1)f(x)总是≥0(

2021-01-05 18:49:41 2501

原创 Python学习之——Pandas的极简用法

Pandas先引入Pandas模块,别名为“pd”import pandas as pd下面用到的数据集长这样:阅读csv文件和excel文件阅读csv文件(comma separated values file)read_csv()方法的参数是该文件所在路径:csv_path = 'https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/PY0101EN/Chapter%204/

2021-01-05 10:56:18 405 2

原创 SQL学习之——distinct参数,聚集不同值

聚集不同值AVG(),COUNT(),MIN(),MAX(),SUM()这五个聚集函数都可以如下使用:对所有行执行计算,指定ALL参数或不指定参数(因为ALL是默认行为)只包含不同的值来聚集,指定DISTINCT参数提示:????ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。下面的例子使用AVG函数返回特定供应商提供的产品的平均价格。使用了dictinct参数,因此平均值只考虑不同的产品价格,不考虑每种产品的数量。select avg(distinct

2021-01-03 11:18:02 582 3

原创 SQL学习之——聚集函数

聚集函数MAX()函数max()函数返回指定列中的最大值,参数是指定的列名。select max(prod_price) as max_price from Products;* 注:在Mysql数据库中,将max()函数用于文本数据时,max()返回按该列排序后的最后一行。下面的图表示按cust_name列排序后的数据。注:max()函数忽略列值为NULL的行。MIN()函数MIN()函数正与MAX()函数相反。即用在数值型列上时,返回的是该列的最小值。当用在文本型的数值列上时,My

2021-01-03 10:55:25 383

原创 二项分布

二项分布概要二项分布是离散型数据分布发生的结果只有“成功”,“失败”两种情况。所以被称为“二项分布”,也称“伯努利分布”。满足二项分布的随机变量的均值、方差、标准差n为实验的次数,p为每次实验成功的概率。...

2021-01-02 11:41:23 2307

原创 多个随机变量运算后的均值与方差计算

和的平均值多个随机变数,其和的平均值的计算方法:对于随机变数X1,X2,...,Xn对于随机变数X_1,X_2,...,X_n对于随机变数X1​,X2​,...,Xn​E(X1+X2+...+Xn)E(X_1+X_2+...+X_n) E(X1​+X2​+...+Xn​)=E(X1)+E(X2)+...+E(Xn)= E(X_1)+E(X_2)+...+E(X_n)=E(X1​)+E(X2​)+...+E(Xn​)随机变数X1,X2,...,Xn互相独立随机变数X_1,X_2,...,X_n互相独

2021-01-02 10:58:35 9065 3

原创 Python学习之——利用文件操作方法进行总成员表的更新,即删除总成员表中的不活跃成员并将这些不活跃成员移到另一张不活跃成员表内

Python学习之——利用文件操作方法进行总成员表的更新,即删除总成员表中的不活跃成员并将这些不活跃成员移到另一张不活跃成员表内两张表的结构:总成员表为members.txt, 不活跃成员表为inactive.txtmembers.txt的结构为:inactive.txt表的结构为:代码如下:with open('members.txt','r+') as writeFile: with open('inactive.txt','a+') as appendFile:

2021-01-01 23:12:47 142 1

原创 Python学习之——lisit的pop方法

Python学习之——lisit的pop方法语法:list.pop([index=-1])可以指定要删除元素的索引,默认为最后一个元素。!!!!!关键是,这个方法的返回值为被删除的元素。# 要删除list中的某个元素直接:members.pop[0]# 如果写成下面这样,那么members就变成了被删除的那一个元素!!!!!members = members.pop[0]...

2021-01-01 22:58:37 660

原创 随机变数的标准化

随机变数的标准化描述由随机变数X经过简单计算得到的随机变数Z,其E(Z) = 0, s(Z) = 1(标准差)。这一过程被称为随机变数的标准化。Z的期待值与标准差上面的式子展开:根据aX+b的期望公式,并结合Z的展开式,可以得到Z的期望为:根据aX+b的标准差公式:并结合Z的展开式,可以得到Z的标准差公式为:由于经标准化后的随机变量的数学期望为0、方差为1,从而使在许多问题中易于处理...

2020-12-31 20:13:19 4268

原创 Python学习之——strip()方法和split()方法的辨析

Python学习之——strip()方法和split()方法的辨析先来康康这两个英文单词的含义:strip:除去,剥去(一层);(尤指)剥光split:分裂,使分裂(成不同的派别);分开,使分开(成为几个部分)一、strip()方法描述Python strip() 方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。语法str.strip([chars]);参数chars – 移除字符串头尾指定的字

2020-12-30 22:57:38 898 1

原创 Python学习之——文件的操作

Python学习之——文件的操作(1)阅读文件内容——open方法以及返回的文件对象的一些方法及属性open方法第一个参数是需要打开的文件的路径,第二个参数是打开方式,有“r”,“w”两种打开方式。“r”代表从文件读内容,“w”代表写入内容到文件中。默认打开方式是“r”。open方法返回一个文件对象,文件对象具有一些属性和内置方法。文件对象的属性name(文件名),mode(打开模式)example1 = "Example1.txt"file1 = open(example1, "r")f

2020-12-30 21:43:46 575

原创 Python学习之——异常捕获结构

Python学习之——异常捕获结构try-except结构try-except使用实例当“try”块内发生了异常的情况:当“try”块内没有发生异常的情况:指定特定异常的try-except结构这种指定异常类型的好处就是:可以根据特定的异常来执行特定的操作当遇到某些没有被明确指出的异常类型时,程序还是可以暂停执行如果不希望程序停止,也可以在明确指出几种异常以后,再添加一个空的except捕获其他异常。下面是指定特定异常的try-except结构的例子:ZeroDivi

2020-12-29 12:32:17 201

原创 统计学习之——随机变数与概率分布

统计学习之——随机变数与概率分布随机变数当X满足以下三个条件时,X是随机变数X是变数X可以取值的范围是一定的X取特定值的概率是一定的(所有X概率的和为1)随机变数又分为1. 离散型随机变量概率分布随机变数也有平均值,被称作期待值。一般来说,当随机变数X的概率分布表如下表时随机变数X的平均值(或期待值)定义如下:概率分布随机变数X的值与概率P的对应关系,被称为概率分布。概率分布既可以通过表格也可以通过图像来进行表示。通过图像来表示随机变数X(掷骰子的结果)的概率分布* 通过图

2020-12-29 00:56:12 2896

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除