膜众dalao的小仙女-CSDN博客

原创代码随想录打卡day01

leetcode 704，27打卡

2022-10-13 01:50:35 96

原创 scikit-learn task05打卡-kmeans

import matplotlib.pyplot as pltfrom sklearn.datasets import make_blobsfrom sklearn.cluster import KMeans# make_blobs：生成聚类的数据集# n_samples：生成的样本点个数，n_features：样本特征数，centers：样本中心数# cluster_std：聚类标准差，shuffle：是否打乱数据，random_state：随机种子X, y = make_blobs(n_s.

2021-12-28 00:07:37 645

原创 sklearn-task04 决策树

一、使用鸢尾花数据集：绘制漂亮的violinplot和pointplot图：# 设置颜色主题antV = ['#1890FF', '#2FC25B', '#FACC14', '#223273', '#8543E0', '#13C2C2', '#3436c7', '#F04864'] # 绘制violinplotf, axes = plt.subplots(2, 2, figsize=(8, 8), sharex=True)sns.despine(left=True) # 删除上方和右方

2021-12-25 00:39:08 792

原创 sklearn task03打卡-朴素贝叶斯

一、生成随机数数据集from sklearn.datasets import make_blobs# make_blobs：为聚类产生数据集# n_samples：样本点数，n_features：数据的维度，centers:产生数据的中心点，默认值3# cluster_std：数据集的标准差，浮点数或者浮点数序列，默认值1.0，random_state：随机种子X, y = make_blobs(n_samples = 100, n_features=2, centers=2, random_

2021-12-22 00:36:52 107

原创 sklearn-datawhale学习笔记2

一. 线性SVM初始化x，y的值，第一列为x，第二列为y，生成6组label为1，6组label为0的数据import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svmdata = np.array([ [0.1, 0.7], [0.3, 0.6], [0.4, 0.1], [0.5, 0.4], [0.8, 0.04], [0.42, 0.6], [0.

2021-12-19 01:16:01 106

原创 scikit-learn task01打卡-逻辑回归和线性回归

scikit-learn学习笔记

2021-12-16 00:26:30 1294

原创 task05笔记

Datawhale 知识图谱组队学习之 Task 5 Neo4j 图数据库查询特别鸣谢：QASystemOnMedicalGraph目录Datawhale 知识图谱组队学习之 Task 5 Neo4j 图数据库查询目录一、 Neo4介绍二、基于知识图谱的问题系统主体类 AnswerSearching 框架介绍三、代码分模块介绍参考资料一、 Neo4介绍Neo4j是一个世界领先的开源图形数据库，由Java编写。图形数据库也就意味着它的数据并非保存在表或集合中，而是

2021-01-16 23:36:29 92

原创 task04笔记

Datawhale 知识图谱组队学习之 Task 4 用户输入->知识库的查询语句特别鸣谢：QASystemOnMedicalGraph目录Datawhale 知识图谱组队学习之 Task 4 用户输入->知识库的查询语句目录一、引言二、什么是问答系统？2.1 问答系统简介2.2 Query理解2.2.1 Query理解介绍2.2.2 意图识别2.2.3 槽值填充三、任务实践四、主体类 EntityExtractor 框架介绍五、命名

2021-01-15 22:51:56 132

原创 task11_final

以下是Datawhale组队pandas学习task11中的题目【任务四】显卡日志下面给出了3090显卡的性能测评日志结果，每一条日志有如下结构：Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称，#2#的值为train(ing)或inference，表示训练状态或推断状态，#3#表示耗时，#4#表示精度，其中包含了float, half, double三种类型，下面

2021-01-13 23:21:49 110

原创 task03笔记

Datawhale 知识图谱组队学习之 Task 3 Neo4j图数据库导入数据特别鸣谢：QASystemOnMedicalGraph目录Datawhale 知识图谱组队学习之 Task 3 Neo4j图数据库导入数据目录一、Neo4j简介1.1 基本概念1.2 索引1.3 Neo4j的优势二、Neo4j 数据导入2.1 数据集简介2.2 数据导入2.2.1 Neo4j 账号密码设置2.2.2 导入数据2.3 知识图谱展示2.4 主体类 Medica

2021-01-13 15:04:49 249

原创 task02笔记

Task 2 基于医疗知识图谱的问答系统操作系统搭建以下内容均出自于Datawhale组队学习任务特别鸣谢：QASystemOnMedicalGraph目录Datawhale 知识图谱组队学习之 Task 2 基于医疗知识图谱的问答系统操作介绍目录一、运行环境二、搭建知识图谱三、启动问答测试参考资料一、运行环境1.使用anaconda+pycharm(windows)共同运行，为了避免环境的冲突问题，最好在anaconda中新建python为3.7版本的虚拟环境

2021-01-12 21:26:48 147 1

原创 task01笔记

Datawhale 知识图谱组队学习之 Task 1 知识图谱安装和介绍以下笔记均参考DataWhale知识图谱组队学习所提供的笔记目录Datawhale 知识图谱组队学习之 Task 1 知识图谱介绍目录一、Neo4J 介绍与安装1.1 引言1.2 Neo4J 下载1.3 Neo4J 安装1.4 Neo4J Web 界面介绍1.5 Cypher查询语言二、Neo4J 实战2.1 引言2.2 创建节点2.3 创建关系2.4 创建出生地关系2.5 图数据

2021-01-11 16:11:08 240

原创 pandas_day10

import numpy as npimport pandas as pd1.时间戳-Timestamp ，一系列的时间戳可以组成DatetimeIndex，把它放到Series中变成datetime64[ns]，涉及时区 datetime64[ns, tz] tz-timezone2.时间差两个Timestamp做差就得到时间差，用Timedelta表示。一系列的时间差组成TimedeltaIndex，放到Series中，Series类型就变为了timedelta64[ns]3.时间段在

2021-01-10 23:20:44 107

原创 pandas_day09

import numpy as npimport pandas as pd9.1 cat对象9.1.1 cat对象的属性pandas提供了category类型，使用户能够处理分类类型的变量，将一个普通序列转换成分类变量，可以使用astype方法df = pd.read_csv('learn_pandas.csv',usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight'])df.head()

2021-01-07 23:42:03 161 2

原创 pandas_day08

import numpy as npimport pandas as pdimport re8.1 str对象8.1.1 str对象的设计意图str对象是定义在Index或Series上的属性，专门用于逐元素处理文本内容。对一个序列进行文本处理，首先要获取其str对象。处理方法同python相像var = 'abcd'str.upper(var) #python 内置str模块'ABCD's = pd.Series(['abcd', 'efg', 'hi'])s.str&lt

2021-01-06 23:13:49 111

原创 pandas_day07

import numpy as npimport pandas as pd7.1 缺失值的统计和删除7.1.1 缺失信息的统计缺失数据可以使用isna或isnull来查看每个单元格是否缺失，通过和sum的组合计算出每列缺失值的比例df = pd.read_csv('learn_pandas.csv', usecols = ['Grade','Name','Gender','Height','Weight','Transfer'])df.isna().head()

2021-01-03 23:28:33 132

原创综合练习11

import pandas as pdimport numpy as npdf1 = pd.read_csv('company.csv')df1.head() 证券代码日期 0 #000007 2014 1 #000403 2015 2 #000408 2016

2021-01-01 23:34:02 156

原创 pandas_day06

import numpy as npimport pandas as pd6.1 关系型连接6.1.1 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作，例如学生期末考试各个科目的成绩表按照姓名和班级连接成总的成绩表，又例如对企业员工的各类信息表按照员工 ID 号进行连接汇总。由此可以看出，在关系型连接中，键是十分重要的，往往用 on 参数表示。另一个重要的要素是连接的形式。在 pandas 中的关系型连接函数 merge 和 join 中提供了 how 参数来代表连接形

2020-12-29 23:31:44 71

原创 pandas_day05

5.1 长宽表的变形一个表中把性别存储在某一个列中，那么它就是关于性别的长表；如果把性别作为列名，列中的元素是某一其他的相关特征数值，那么这个表是关于性别的宽表。import pandas as pdimport numpy as nppd.DataFrame({'Gender':['F','F','M','M'],'Height':[163, 160, 175, 180]}) Gender Height

2020-12-27 22:15:58 65

原创 pandas_day04

4.1分组模式及其对象如，依据性别分组，统计全国人口寿命的平均值要想实现分组操作，必须明确3个要素：分组依据、数据来源、操作及其返回结果import pandas as pdimport numpy as npdf = pd.read_csv('learn_pandas.csv')# 按照性别统计身高中位数df.groupby('Gender')['Height'].median()GenderFemale 159.6Male 173.4Name: Height, d

2020-12-25 14:01:05 124 3

原创 pandas_day03

import numpy as npimport pandas as pddf = pd.read_csv('learn_pandas.csv',usecols = ['School','Grade', 'Name','Gender','Weight','Transfer'])# 把Name列设为索引df_demo = df.set_index('Name')df_demo School Grade Gender

2020-12-22 23:12:22 6776 2

原创 task02_01

import numpy as npimport pandas as pdpd.__version__'1.1.5'2.1.1df_csv = pd.read_csv('my_csv.csv')df_csv col1 col2 col3 col4 col5 0 2 a 1.4 apple 20

2020-12-19 23:49:22 145 1

qq_38048065的博客