自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 资源 (1)
  • 收藏
  • 关注

原创 算法-HMM

2022-01-07 23:20:11 77

原创 算法-LDA

2022-01-01 22:43:44 119

原创 算法-贝叶斯网络

2021-12-27 00:21:39 258

原创 算法-EM算法

EM算法可以用来分类混合高斯分布的数据。先给出三个变量π,μ和,经过多次迭代,更新这三个参数,直到收敛为止。

2021-12-18 18:18:36 156

原创 算法-SVM

对于一条直线:y = 1/2 * x + 1 来说。换个形式:-x + 2y -1 = 0f(x, y) = -x + 2y -1把系数提出来,w = (-1 2)竖着的, 这个(-1 2)就是直线f(x, y)的法向量f(x->) = w -> T .x -> + b,对于二维来说,x = (x1, x2),n维的话 x = (x1, x2 ,,,,xn)如果给定一个x->, 如果f(x->) > 0, 说明x -&g...

2021-11-24 23:50:14 490

原创 算法-提升

​​​​​​​:实际值:t-1次分类器的预测值:t次的分类器:损失函数:正则项:常数由1到2,是因为做了转换,看成所有落在叶子1的节点,也就是w1(g1+g3+g4+……+gi)这种,加和有1-n换成了i-T(所有叶子节点)adaboost用来第一次,每个w都相同,都是1/N,m是指不同的分类器,共M类,:如果预测值和实际值不相同,就是True,这个m次分类器的错的w就会被拿出来,如果预测值和实际值相同,...

2021-11-21 17:30:52 422

原创 算法-KMEANS

2021-11-01 21:04:11 67

原创 算法-逻辑回归

from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import LinearRegression, SGDRegressor, Ridge, LogisticRegressionfrom s...

2021-11-01 21:01:49 55

原创 算法-线性回归,岭回归

from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import LinearRegression, SGDRegressor, Ridgefr...

2021-10-31 23:42:43 372

原创 算法-决策树,随机森林

def decision(): """ 决策树对泰坦尼克号进行预测生死 :return: None """ # 获取数据 titan = pd.read_csv("http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt") # 处理数据,找出特征值和目标值 x = titan[['pclass'...

2021-10-30 23:00:00 99

原创 算法-KNN, 朴素贝叶斯

朴素贝叶斯算法import pandas as pdfrom sklearn.preprocessing import StandardScalerfrom sklearn.model_selection import train_test_split, GridSearchCVfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.datasets im...

2021-10-30 16:58:12 145

原创 算法-sklearn特征工程

from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizerfrom sklearn.feature_extraction import DictVectorizerimport jiebafrom sklearn.preprocessing import MinMaxScaler, StandardScalerfrom sklearn.impute import SimpleImputerimp...

2021-10-27 22:09:47 90

原创 算法-sklearn特征工程

from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizerfrom sklearn.feature_extraction import DictVectorizerimport jiebafrom sklearn.preprocessing import MinMaxScaler, StandardScalerfrom sklearn.impute import Sim...

2021-10-26 19:54:55 58

原创 算法-pandas-时间序列

#911数据中不同月份不同类型的电话的次数的变化情况import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltfile_path = './911.csv'data = pd.read_csv(file_path)# print(data.head(3))# print(data.info())#将电话类别筛出来temp_list = data['title'].str.split(': ...

2021-10-14 20:49:25 187

原创 算法-pandas-数据合并与聚合分组

1、字符串离散化将字符串形式的分类情况转化为类别。import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltfile_path = './IMDB-Movie-Data.csv'data = pd.read_csv(file_path)# print(data.head)# print(data.info())# print(data['Genre'].tolist())genreL

2021-10-11 22:33:09 144

原创 算法-pandas

1、import pandas as pdimport numpy as np#直接创建t1 = pd.Series([1, 2, 31, 12, 2, 2])print(t1)# 0 1# 1 2# 2 31# 3 12# 4 2# 5 2#index也可以赋予t2 = pd.Series([1, 2, 31, 12, 2, 2], index=list("abcdef"))print(t2)# a 1# .

2021-09-28 23:33:18 143

原创 算法-numpy

1.nimpy数组的创建,类型,类型准换import numpy as npimport random#创建np数组的三种方式t1 = np.array([1, 2, 3])print(t1)print(type(t1))t2 = np.array(range(10))print(t2)print(type(t2))t3 = np.arange(0, 10, 2)print(t3)print(type(t3))#numpy的数组类型是ndarrayprint(t3.dt

2021-09-27 21:54:06 182

原创 算法-matplotlib

举个例子:from matplotlib import pyplot as plt# x y赋值x = range(2,26,2)y = [15,13,14.5,17,20,25,26,26,27,22,18,15]# 构建图plt.plot(x, y)# 展示图plt.show()from matplotlib import pyplot as plt# x y赋值x = range(2,26,2)y = [15,13,14.5,17,20,25,26,26,27

2021-09-24 16:17:10 154

原创 算优化问题

2021-09-22 21:43:31 45

原创 算法-概率论(数字特征与特征函数)

正态分布:指数分布:伽玛分布:贝塔分布

2021-09-16 21:49:12 219

原创 算法-概率论(随机变量)

2021-09-15 17:28:52 78

原创 算法-概率论(随机变量与分布函数)

2021-09-13 20:37:13 99

原创 算法-概率论(条件概率、贝叶斯公式、统计独立性)

​​​​​​​

2021-09-09 22:50:57 166

原创 算法-概率论(基本概念、古典概型、几何概型)

​​​​​​​

2021-09-08 23:52:20 231

原创 算法-矩阵(二次型、正定矩阵、LU、SVD分解)

2021-09-07 23:25:18 378

原创 算法-矩阵(乘法、秩、可逆、相似、特征值、特征向量)

2021-09-07 21:59:30 137

原创 算法-矩阵(基、维数)

2021-08-31 21:43:04 211

原创 算法-矩阵(线性方程组)

2021-08-31 21:11:12 97

原创 算法-矩阵(基本定义)

2021-08-30 19:26:05 78

原创 算法-数学基础(多元微分)

​​​​​​​

2021-08-29 16:24:01 144

原创 算法-数学基础(积分)

2021-08-26 21:55:02 66

原创 算法-数学基础(极限、导数、微分、泰勒展开式)

极限链式法则求导洛必达法则微分中值定理泰勒公式

2021-08-24 23:12:36 201

原创 算法-树

class Node(object): def __init__(self, item): self.elem = item self.lchild = None self.rchild = Noneclass Tree(object): def __init__(self): self.root = None def add(self, item):...

2021-08-22 16:19:57 56

原创 算法-排序很热查找

1.冒泡排序#冒泡排序def bubble_sort(alist): for i in range(0, len(alist) - 1): #从头到尾跑几次 count = 0 #用来标记这一趟比较是否有移动过元素,没有移动过说明已经是有序的了 #保证最优时间复杂的是O(n) for j in range(0, len(alist) - 1 - i): #每次比较完...

2021-08-22 00:48:31 80

原创 算法-栈

# Stack() 创建一个新的空栈# push(item) 添加一个新的元素item到栈顶# pop() 弹出栈顶元素# peek() 返回栈顶元素# is_empty() 判断栈是否为空# size() 返回栈的元素个数class Stack(object): def __init__(self): self.__list = [] def push(self, item): # push(item) 添加一个新的元素item...

2021-08-17 11:05:19 37

原创 算法-链表

#节点class Node(object): def __init__(self, elem): self.elem = elem self.next = None#单向链表class SingleLinkList(object): #初始化的时候要传节点,不然就默认空,头指向空 def __init__(self, node = None): self.__head = node #链表是否为...

2021-08-15 22:57:20 45

原创 算法-顺序表

顺序表在程序中,经常需要将一组(通常是同为某个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等。一组数据中包含的元素个数可能发生变化(可以增加或删除元素)。对于这种需求,最简单的解决方案便是将这样一组元素看成一个序列,用元素在序列里的位置和顺序,表示实际应用中的某种有意义的信息,或者表示数据之间的某种关系。这样的一组序列元素的组织形式,我们可以将其抽象为线性表。一个线性表是某类元素的一个集合,还记录着元素之间的一种顺序关系。线性表是最基本的数据结构之一,在实

2021-08-13 20:35:59 65

原创 算法-算法入门

算法的概念算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。一般地,当算法在处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或某个存储地址供以后再调用。算法是独立存在的一种解决问题的方法和思想。对于算法而言,实现的语言并不重要,重要的是思想。算法可以有不同的语言描述实现版本(如C描述、C++描述、Python描述等),我们现在是在用Python语言进行描述实现。算法的五大特性输入: 算法具有0个或多个输入...

2021-08-13 09:23:08 61

原创 Andrew Ng网课笔记-Linear Regression(二)

1. 本章要做什么上一章我们说到一个参数的线性回归,房价只和一个参数房子面积的关系,这一章,我们要讲多个参数的线性回归。多元线性回归(multivariate linear regression)比如:房价与房子面积、卧室间数、房子层数、房龄等多个元素之间的关系。符号表示:房子面积、卧室间数、房子层数、房龄、房价分别用x1, x2, x3, x4,y来表示。M:仍然是样本的总数量n : 特征数量即...

2018-05-14 05:08:53 412

原创 Andrew Ng网课笔记-Linear Regression(一)

这一讲说到了线性回归(Linear Regression)线性回归是一种监督式学习。我们给机器一些带标签的数据,然后机器用这些带标签的数据学习。1.从一个例子入手首先Ng老师举了个例子:这是有关于房价预测的例子。图中的点横坐标是面积,从纵坐标是房价, 我们要做的事情是想找到一个模型,让这个模型更好的符合当前的房价与面积的对应关系,之后我们用这个模型简单的预测房价。首先,我们有一些training ...

2018-03-05 05:39:21 257

中文java api

java 的说明文档,用于查找一些不太熟悉的类,有助于我们更好地学习java

2014-04-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除