- 博客(21)
- 收藏
- 关注
原创 Part 02 : Introduction to Data Science
In this lesson, you will learn about CRISP-DM and how you can apply it to many data science problems.Business UnderstandingExamples include:Data Understandingat this step, you need to move the questions from Business Understanding to data. You might alre
2023-05-27 14:41:31 78
原创 Assign01: A Look at the Data
在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有。normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。,并计算每个不同值有在该列中的个数,同时还能根据需要进行排序。dropna=True:是否删除缺失值nan,默认删除。bins=None: 可以自定义分组区间,默认是否;sort=True: 是否要进行排序;ascending=False: 默认降序排列;
2023-05-27 11:34:12 245 1
原创 R语言学习-Day 1
以看懂和复现上几篇文章公布的R代码进行数据分析的部分为目标,深入学习学术论文中的数据分析,顺便学习R语言的小技巧,如rmarkdown。
2022-11-13 17:57:31 104
原创 DataCamp: Intermediate Python-Dictionaries & Pandas
Table of ContentsDictionariesMotivations for dictionariesCreate DictionaryAccess DictionaryList vs. DictionaryDictionary Manipulation-addDiactionary Manipulation (2)- updateDictionariceptionPandasDictionary to DataFrame(1)Dictionary to DataFrame(2)CSV to D
2022-03-05 11:06:24 887
原创 Coursera-Introduction to Data Science in Python-Day 1
Introduction to Data Science - Week 1
2022-03-05 00:13:35 781
原创 Research Project_001_Data Analysis Log
Research Project_001_Data Analysis Log1. First Round Data Analysis1.1 Details and Loadings of the Measures1.1.1 Confirmatory Factor Analysis(CFA)-SPSS1.2 Internal Consistency and Discriminant Validity1.2.1 Composite Reliability (CR)1.2.2 Cronbach's alpha
2021-10-05 18:20:05 197 2
原创 Python数据分析与机器学习实战笔记(11)-决策树算法
文章目录决策树算法1. 决策树算法概述2. 熵的作用3. 信息增益原理4. 决策树构造实例5. 信息增益与gini系数6. 预剪枝和后剪枝7. 回归问题解决决策树算法1. 决策树算法概述既可以做分类也可以做回归2. 熵的作用H(U)=E[−logpi]=−∑i=1npilogpiH(U)=E\left[-\log p_{i}\right]=-\sum_{i=1}^{n} ...
2020-03-30 09:17:06 121
原创 Python数据分析与机器学习实战笔记(10) - 项目实战(交易数据异常检测)
文章目录项目实战(交易数据异常检测)1. 信用卡欺诈检测1.1 任务流程:1.2 主要解决问题:2. 项目总结项目实战(交易数据异常检测)1. 信用卡欺诈检测基于信用卡交易记录数据建立分类模型来预测哪些交易记录是异常的哪些是正常的。1.1 任务流程:a. 加载数据,观察问题b. 针对问题给出解决方案c. 数据集切分d. 评估方法对比e. 逻辑回归模型f. 建模结果分析g. ...
2020-03-02 17:14:36 1054 1
原创 Python数据分析与机器学习实战笔记(9) - 案例实战python实现逻辑回归
文章目录案例实战python实现罗辑回归1. 任务概述1.1 The logistic regression1.2 要完成的模块1.2.1 sigmoid 函数1.2.2 model1.2.3 cost 损失函数1.2.4 gradiant 计算梯度1.2.5 Gradiant descent1.2.5.1 不同的停止策略1.2.5.2 对比不同的梯度下降方法1.2.6 进行参数更新1.2.7 计...
2020-03-02 12:00:35 233
原创 Python数据分析与机器学习实战笔记(8) - 逻辑回归
文章目录逻辑回归1. logestic regression2. Sigmoid 函数化简与求解逻辑回归1. logestic regression2. Sigmoid 函数化简与求解⚠️sigmoid 函数的求导:
2020-03-01 22:08:36 117
原创 Python数据分析与机器学习实战笔记(6) - 线性回归算法原理推导
文章目录线性回归算法原理推导1. 回归问题概述2. 误差项定义3. 独立同分布的意义4. 似然函数的作用5. 参数求解6. 评估方法线性回归算法原理推导1. 回归问题概述2. 误差项定义3. 独立同分布的意义注意⚠️: 该式表示找theta 和 x 的组合,使二者的乘积成为y 的可能性越大越好4. 似然函数的作用⚠️问题:似然函数为什么是累积?独立同分布数据:联...
2020-03-01 20:35:45 145
原创 Python数据分析与机器学习实战笔记(5) - K近邻算法
文章目录K 近邻算法1. K近邻算法概述1.1读取数据1.2 K nearest Neighbor 算法1.3(欧式)距离的定义1.4 模型评估1.4.1 首先制定好训练集和测试集1.4.2 基于单变量预测价格1.4.3 Root Mean Squared Error 均方根误差1.4.4 不同的变量效果会不会不同呢1.4.5 数据标准化,归一化2. sklearn库与功能2.1 standari...
2020-02-27 11:11:34 340 1
原创 Python数据分析与机器学习实战笔记(3)- Matplotlib
MatplotlibMatplotlib基本操作matplotlib 概述import numpy as npimport matplotlib.pyplot as plt%matplotlib inline // notebook中plt.plot([1,2,3,4,5],[1,4,9,16,25])plt.xlabel('xlabel', fontsize = 16)pl...
2020-02-25 08:50:22 487
原创 Python数据分析与机器学习实战笔记(2) - Pandas
#PandasPandas 工具包使用import pandas as pdpath = "data.csv"df = pd.read_csv(path) df.head()print(help(pd.read_csv))数据信息读取与展示df = pd.read_csv("data.csv")df.info()df.indexdf.columnsdf.dty...
2020-02-24 17:34:41 293
原创 Python数据分析与机器学习实战笔记(1)- Numpy
Numpyimport numpy as np数组一维数组array1 = np.array([1,2,3,4])array1 = array1 +1二维数组array2 = np.array([[1,2,3][4,5,6]])对于ndarray 结构来说,里面所有的元素必须是同一类型,否则,将自动“向下”(e.g. int to float, int to s...
2020-02-24 16:29:55 302
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人