爱吃酸菜鱼的汉堡-CSDN博客

原创 MacOS:如何给pycharm设置Anaconda里的编译环境

一定要选择Anaconda-Navigator.app/Contents/MacOS文件夹下的文件python,就可以使用在anaconda里下载好的一切工具包了。

2022-02-09 04:12:22 863

原创 python：如何对数组按指定列排序

用到的函数就是sorted(iterable, key=None, reverse=False) ，参数j介绍如下：iterable：就是将要被排序的任何可迭代对象（例如list）key：写一个lambda函数，指定每步迭代将要被作为排序标准的元素reverse：默认为False,即升序排列，若为True则为降序排序极简例子：list1 = [[1,20],[2,3],[1,5]]new_list = sorted(list1, key = lambda x:x[1])print(new

2021-12-06 05:10:50 7383

原创 Numpy库实现矩阵乘法以及元素级乘法

想要实现线性代数中讲过的矩阵乘法，即符合矩阵相乘的两个矩阵需要满足条件：第一个矩阵的列数等于第二个矩阵的行数。使用numpy的库函数：np.matmul。如果参与matmul运算的两个矩阵尺寸不满足上述条件则会报错a = np.array([[1,2,3,4],[5,6,7,8]])a# 显示以下结果：# array([[1, 2, 3, 4],# [5, 6, 7, 8]])a.shape# 显示以下结果：# (2, 4) b = np.array([[1,2,3],[4,5,6.

2021-05-13 22:56:28 2131 2

原创 python学习之——在指定的路径下生成文件夹

import osfor i in range(6, 11): path = "processed_data/Hg/3ms-100per-" + str(i) + "mm-hg" os.mkdir(path + './InputData')上面这段代码实现了，在每一个path路径下生成一个InputData文件夹生成结果如下：

2021-03-30 13:27:00 1168

原创 python学习之——同一个项目目录下，如何在一个文件中访问另一个文件中的变量

直接在需要访问其他文件变量的文件中，调用如下语句：from 变量所在文件名 import 变量名例如，文件InputData.py生成变量input_wave现在想在文件InputCucl2.py中调用input_wave如下

2021-03-29 17:13:41 1285

原创满秩矩阵与正定矩阵

满秩矩阵设A是n阶矩阵, 若r（A） = n, 则称A为满秩矩阵。但满秩不局限于n阶矩阵。若矩阵秩等于行数，称为行满秩；若矩阵秩等于列数，称为列满秩。既是行满秩又是列满秩则为n阶矩阵即n阶方阵。矩阵的秩：用初等行变换将矩阵A化为阶梯形矩阵, 则矩阵中非零行的个数就定义为这个矩阵的秩, 记为r（A），根据这个定义, 矩阵的秩可以通过初等行变换求得。需要注意的是, 矩阵的阶梯形并不是唯一的, 但是阶梯形中非零行的个数总是一致的。阶梯形矩阵：其特点为：每个阶梯只有一行；元素不全为零的行（非零行）的

2021-03-27 11:18:06 7918

原创 Python学习之——“and”运算符的说明：短路+多个真值时的选择问题

今天在牛客刷到一道奇奇怪怪的算法题，是酱婶的：参考了一下通过的代码，是酱婶的：# -*- coding:utf-8 -*-class Solution: def Sum_Solution(self, n): # write code here return n and (n + self.Sum_Solution(n-1))用到了递归。理解这个答案的关键就在于对and的理解：r“短路原则”：当两个表达式进行and运算时，如果第一个（左边）的表达式结果

2021-03-26 11:02:10 303 1

原创 python学习之——使用range生成逆序排序的list

range(start, end, step)start为逆序list里最大的数值end为逆序list里（最小-1）的数值step为-1示例：

2021-03-07 21:04:44 498

原创假设检验与P值的理解

假设检验的目标是回答这个问题，“给定一个样本和一个明显的effect，偶然看到这种effect的概率是多少?”第一步：通过选择一个检验统计量(t检验、方差分析等)来量化表观该effect的大小。第二步：定义一个null hypothesis，null hypothesis是一个基于假设 “该effect不成立” 的系统模型。第三步：计算p值（p-value）第四步：解释p值的结果P-value的理解p值就是null hypothesis成立的概率。如果这个值很低（一般小于0.05），那么这个

2021-02-22 18:47:42 949

原创偏态分布

偏态分布分为正偏态分布和负偏态分布。正偏态分布正偏态分布是相对正态分布而言的。当用累加次数曲线法检验数据是否为正态分布时，若X‾\overline{X}X>Me>Mo时，即平均数（X‾\overline{X}X）大于中数（Me），中数又大于众数（Mo），则数据的分布是属于正偏态分布。正偏态分布的特征是曲线的最高点偏向X轴的左边，位于左半部分的曲线比正态分布的曲线更陡，而右半部分的曲线比较平缓，并且其尾线比起左半部分的曲线更长，无限延伸直到接近X轴。负偏态分布负偏态分布也是相对正态分布

2021-02-22 12:30:28 2887

原创 Pandas的学习之——使用Pandas进行描述性统计

首先引入需要的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pyplot读取数据ratings_url = 'https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBMDeveloperSkillsNetwork-ST0151EN-SkillsNetwork/labs/teachingratings.csv'rating.

2021-02-09 22:30:30 6133

原创 Pandas学习之——使用pandas获取数据以及数据概览

1 数据获取先引入必要的库import pandas as pdimport numpy as np1.1 读取数据使用方法：pandas.read_csv()参数：（1）文件所在的路径（2）headers：设置参数headers=None，pandas将不会自动将数据集的第一行设置为列表表头（列名）other_path = "https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/

2021-02-08 21:51:33 8394

原创 SQL学习之——DM2数据库里的一些关键字

下面得sql查询语句只限在DB2数据库中有效。1 使用“null last”关键字来降序排序来取前10行数据，排除null值查询要求：找出学生出勤率最高的十所学校的名称执行代码：select Name_of_School, Average_Student_Attendance from SCHOOLS order by Average_Student_Attendance desc limit 10查询结果：返回的第一行为空值，并不是我们想要的。改进查询语句：加入关键字

2021-02-03 23:01:51 228

原创 SQL学习之——使用JOIN关键字来进行不同表之间的连接查询

有两种连接方式，inner join和outer join其中outer join又分为三种：left outer joinright outer joinfull outer join下面通过实际例子来理解记录：用到的数据库表格如下：1 选择为部门号为5的所有员工的姓名、工作开始日期和工作头衔。select E.F_NAME,E.L_NAME, JH.START_DATE, J.JOB_TITLE from EMPLOYEES as E INNER JOIN JOB_HIST

2021-02-03 01:08:58 701

原创 SQL学习之——sub-query在多表连结查询中的应用

有三种方式能够在一条sql语句中查询多个表的内容，分别是使用子查询语句sub-queryimplicit JOINJOIN operators：INNER JOIN, OUTER JOIN1 使用sub-query例如下面的sql，用于查询DEP_ID在departments表中的员工信息。这个查询需要用到employees和departments两张表。select * from employees where dep_id in (select dept_id_dep from de

2021-01-27 20:16:16 766

原创 SQL学习之——subqueries子查询

sub-queries可以用在查询语句中的多个位置。1 sub-queries用在where clause中SQL中的聚合函数（如sum(),avg()等）不能用在where子句中。例如，下面的sql语句将会报错：select * from employees where salary > avg(salary)上面sql语句的查询目的是，在employees表中，查找那些薪水高于平均薪水的员工的信息。虽然不可以像上面那样写，但是可以使用sub-queries子查询语句来实现同样的功能。s

2021-01-27 16:19:26 1625

原创最简单的神经网络内部计算原理理解

最简单的神经网络内部计算原理理解下面使用到的，是一个具有两个输入节点，以及两个输出节点的极简神经网络。层1 是输入节点，这层的节点只是展示输入值的功能，不做其他计算。从输入层到输出层之间总共有四种连接方式（即上面四个绿色箭头），首先，随机初始化这四个连接的权重。权重是神经网络进行学习的内容，这些权重持续进行优化，得到越来越好的结果。对于第二层输出层，这一层的每个节点，都需要计算出组合输入，即原始输入分别乘以相应的权重并相加，得到的组合输入。然后，利用激活函数，例如sigmoid函数：y=11+

2021-01-26 20:48:26 563

原创 SQL学习之——order by

SQL学习之——order by多个排序、count(*)统计总行数、having语句注意事项1 order by可以实现多层排序例：查询需求：查出员工的姓和名以及部门id，部门id降序排序。在同一个部门下，员工根据姓（last name）降序排序。select F_NAME, L_NAME, DEP_ID from EMPLOYEES ORDER by dep_id desc , l_name descorder by 语句后面可以有多个排序条件，前后顺序代表了排序的先后顺序查询结果：

2021-01-24 20:59:19 959

原创 SQL学习之——having关键字

SQL学习之——having关键字注：和where语句的不同之处是，where语句针对的对象是全部的结果集合；而having语句针对的是group by分组以后的各个组别。详见下图示例：

2021-01-21 16:24:09 404

原创 Python学习之——HTTP协议的一些基本概念以及Python库Requests

Python学习之——HTTP协议的一些概念以及Python库Requests1 HTTP的概述1.1 URL:Uniform Resource Locator统一资源定位符1.2 Request：请求1.3 Response：响应2 Python库：Requests2.1 获取带有URL参数的请求2.2 Post请求...

2021-01-16 12:00:00 394

原创 Python学习之——Pandas用法进阶

Python学习之——Pandas用法进阶下面要用到的例子需要提前先安装nba_api!pip install nba_api1. Pandas是一个API1.1 函数one_dict先定义一个函数：将一个内部元素是字典的list（函数的参数）转换为一个字典（输出）。因为后面会用到。参数list中的每个字典元素具有一模一样的结构（key保持一致），最终转换出的结果字典将参数list中的每一个不同的value都统一汇总到相对应的key下面。def one_dict(list_dict):

2021-01-12 12:33:53 480 2

原创 Python学习之——字典对象的items()方法

字典对象的items()方法返回可遍历的(键, 值) 元组数组。dict = {'Google': 'www.google.com', 'Runoob': 'www.runoob.com', 'taobao': 'www.taobao.com'}for key,value in dict.items(): print("key:%s" % key) print("value:%s" % value)输出：key:Googlevalue:www.google.comkey:R

2021-01-11 18:06:55 247

原创 Python学习之——2d Numpy基本用法

Python学习之——2d Numpy基本用法先引入相关的包：import numpy as np import matplotlib.pyplot as plt1. 创建一个2D的Numpy数组将一个list转化为一个Numpy数组a = [[11, 12, 13], [21, 22, 23], [31, 32, 33]]A = np.array(a)A输出：array([[11, 12, 13],[21, 22, 23],[31, 32, 33]])使用ndim属性查

2021-01-11 16:35:55 1479

原创机器学习算法衡量指标——准确率、精确率（查准率）、召回率（查全率）

机器学习算法衡量指标在分类问题中，将机器学习模型的预测与实际情况进行比对后，结果可以分为四种：TP、TN、FN、FP。每个的第一个字母：T/F，代表预测结果是否符合事实，模型猜得对不对，True or False。每个的第二个字母：N/P，代表预测的结果，是Negative，还是Positive。因为对于分类问题，机器学习模型只会输出正类和负类两种预测结果。具体来说：结果描述TPTrue Positive，预测结果为正类，且与事实相符，即事实为正类。TNTrue Neg

2021-01-08 23:27:35 3848

原创机器学习之——“损失函数”与“成本函数”的辨析

机器学习之——“损失函数”与“成本函数”的辨析损失函数与成本函数都表示预测结果与真实情况的偏差。损失函数：是针对单个样本，成本函数：针对整个数据集成本函数是由损失函数计算得到的。不过在实际计算中，可以选择令成本函数为损失函数的总和，也可以令成本函数是损失函数值的平均。无论是总和还是平均，最终目标都是希望最小化成本，从而使假设函数的预测最可靠。...

2021-01-08 17:04:11 1141

原创 Python学习之——1dNumpy基本用法

Python学习之——1dNumpy基本用法引入numpy包import numpy as np1. 简要描述一个numpy数组类似于python中的数据类型list。numpy数组通常具有固定的大小size，数组中的每个元素一定是同种类型的。2. 将list转化为一个numpy数组a = np.array([0, 1, 2, 3, 4])a输出：array([0, 1, 2, 3, 4])和访问list里的元素一样，访问numpy数组也是用同样的方式：print("a[0]:

2021-01-06 17:38:19 1554

原创正态分布以及推测统计简述

正态分布及推测统计简述在概率密度函数中，最常出现且最重要得一种，是呈正态分布的概率密度函数。大致来说，“呈现带有误差现象的数据大多可用正态分布来表示”1 . 正态分布的概率密度函数当随机变数X满足上式所代表的概率密度函数时，X的平均值为μ，方差为σ2，标准差为σ。X的平均值为μ，方差为\sigma^2，标准差为\sigma。X的平均值为μ，方差为σ2，标准差为σ。平均值为μ，方差为σ2的正态分布表示为N（μ，σ2）。平均值为μ，方差为\sigma^2的正态分布表示为N（μ， \sigma^2）。平

2021-01-06 12:32:29 4541

空空如也

空空如也