自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Assign03: How to Break into Field

【代码】Assign03: How to Break into Field。

2023-05-27 19:34:16 71

原创 Assign02: Categorical Variables

The。

2023-05-27 14:43:23 66

原创 Part 02 : Introduction to Data Science

In this lesson, you will learn about CRISP-DM and how you can apply it to many data science problems.Business UnderstandingExamples include:Data Understandingat this step, you need to move the questions from Business Understanding to data. You might alre

2023-05-27 14:41:31 78

原创 Assign01: A Look at the Data

在pandas中,value_counts常用于数据表的计数及排序,它可以用来查看数据表中,指定列里有。normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。,并计算每个不同值有在该列中的个数,同时还能根据需要进行排序。dropna=True:是否删除缺失值nan,默认删除。bins=None: 可以自定义分组区间,默认是否;sort=True: 是否要进行排序;ascending=False: 默认降序排列;

2023-05-27 11:34:12 245 1

原创 How to Become a Data Scientist-Udacity Nano Degree

ContentHelp!

2023-05-25 19:18:51 88

原创 Part 01 : Welcome to the Nanodegree program

Medium:

2023-05-25 19:12:55 36

原创 R语言学习-Day 1

以看懂和复现上几篇文章公布的R代码进行数据分析的部分为目标,深入学习学术论文中的数据分析,顺便学习R语言的小技巧,如rmarkdown。

2022-11-13 17:57:31 104

原创 DataCamp: Intermediate Python-Dictionaries & Pandas

Table of ContentsDictionariesMotivations for dictionariesCreate DictionaryAccess DictionaryList vs. DictionaryDictionary Manipulation-addDiactionary Manipulation (2)- updateDictionariceptionPandasDictionary to DataFrame(1)Dictionary to DataFrame(2)CSV to D

2022-03-05 11:06:24 887

原创 Coursera-Introduction to Data Science in Python-Day 1

Introduction to Data Science - Week 1

2022-03-05 00:13:35 781

原创 Research Project_001_Data Analysis Log

Research Project_001_Data Analysis Log1. First Round Data Analysis1.1 Details and Loadings of the Measures1.1.1 Confirmatory Factor Analysis(CFA)-SPSS1.2 Internal Consistency and Discriminant Validity1.2.1 Composite Reliability (CR)1.2.2 Cronbach's alpha

2021-10-05 18:20:05 197 2

原创 Python数据分析与机器学习实战笔记(11)-决策树算法

文章目录决策树算法1. 决策树算法概述2. 熵的作用3. 信息增益原理4. 决策树构造实例5. 信息增益与gini系数6. 预剪枝和后剪枝7. 回归问题解决决策树算法1. 决策树算法概述既可以做分类也可以做回归2. 熵的作用H(U)=E[−log⁡pi]=−∑i=1npilog⁡piH(U)=E\left[-\log p_{i}\right]=-\sum_{i=1}^{n} ...

2020-03-30 09:17:06 121

原创 Python数据分析与机器学习实战笔记(10) - 项目实战(交易数据异常检测)

文章目录项目实战(交易数据异常检测)1. 信用卡欺诈检测1.1 任务流程:1.2 主要解决问题:2. 项目总结项目实战(交易数据异常检测)1. 信用卡欺诈检测基于信用卡交易记录数据建立分类模型来预测哪些交易记录是异常的哪些是正常的。1.1 任务流程:a. 加载数据,观察问题b. 针对问题给出解决方案c. 数据集切分d. 评估方法对比e. 逻辑回归模型f. 建模结果分析g. ...

2020-03-02 17:14:36 1054 1

原创 Python数据分析与机器学习实战笔记(9) - 案例实战python实现逻辑回归

文章目录案例实战python实现罗辑回归1. 任务概述1.1 The logistic regression1.2 要完成的模块1.2.1 sigmoid 函数1.2.2 model1.2.3 cost 损失函数1.2.4 gradiant 计算梯度1.2.5 Gradiant descent1.2.5.1 不同的停止策略1.2.5.2 对比不同的梯度下降方法1.2.6 进行参数更新1.2.7 计...

2020-03-02 12:00:35 233

原创 Python数据分析与机器学习实战笔记(8) - 逻辑回归

文章目录逻辑回归1. logestic regression2. Sigmoid 函数化简与求解逻辑回归1. logestic regression2. Sigmoid 函数化简与求解⚠️sigmoid 函数的求导:

2020-03-01 22:08:36 117

原创 Python数据分析与机器学习实战笔记(7)- 梯度下降策略

文章目录梯度下降策略1. 梯度下降梯度下降策略1. 梯度下降

2020-03-01 21:18:46 127

原创 Python数据分析与机器学习实战笔记(6) - 线性回归算法原理推导

文章目录线性回归算法原理推导1. 回归问题概述2. 误差项定义3. 独立同分布的意义4. 似然函数的作用5. 参数求解6. 评估方法线性回归算法原理推导1. 回归问题概述2. 误差项定义3. 独立同分布的意义注意⚠️: 该式表示找theta 和 x 的组合,使二者的乘积成为y 的可能性越大越好4. 似然函数的作用⚠️问题:似然函数为什么是累积?独立同分布数据:联...

2020-03-01 20:35:45 145

原创 Python数据分析与机器学习实战笔记(5) - K近邻算法

文章目录K 近邻算法1. K近邻算法概述1.1读取数据1.2 K nearest Neighbor 算法1.3(欧式)距离的定义1.4 模型评估1.4.1 首先制定好训练集和测试集1.4.2 基于单变量预测价格1.4.3 Root Mean Squared Error 均方根误差1.4.4 不同的变量效果会不会不同呢1.4.5 数据标准化,归一化2. sklearn库与功能2.1 standari...

2020-02-27 11:11:34 340 1

原创 Python数据分析与机器学习实战笔记(4)- Seaborn

文章目录SeabornSeabornimport seaborn as sns

2020-02-26 13:57:41 376

原创 Python数据分析与机器学习实战笔记(3)- Matplotlib

MatplotlibMatplotlib基本操作matplotlib 概述import numpy as npimport matplotlib.pyplot as plt%matplotlib inline // notebook中plt.plot([1,2,3,4,5],[1,4,9,16,25])plt.xlabel('xlabel', fontsize = 16)pl...

2020-02-25 08:50:22 487

原创 Python数据分析与机器学习实战笔记(2) - Pandas

#PandasPandas 工具包使用import pandas as pdpath = "data.csv"df = pd.read_csv(path) df.head()print(help(pd.read_csv))数据信息读取与展示df = pd.read_csv("data.csv")df.info()df.indexdf.columnsdf.dty...

2020-02-24 17:34:41 293

原创 Python数据分析与机器学习实战笔记(1)- Numpy

Numpyimport numpy as np数组一维数组array1 = np.array([1,2,3,4])array1 = array1 +1二维数组array2 = np.array([[1,2,3][4,5,6]])对于ndarray 结构来说,里面所有的元素必须是同一类型,否则,将自动“向下”(e.g. int to float, int to s...

2020-02-24 16:29:55 302

Introdution to R-Notes

DataCamp: introduction to R 高质量笔记

2022-12-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除