自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 python语法基础

1、输出hello pythonprint ("hello python")2、注释#井号单行注释“”""""三引号多行注释# print ("hello python")"""print ("hello python")print ("hello python")"""3、标识符第一个字符为字母或下划线其他字符可为字母、下划线、数字如:ab、_ab4、数据类型...

2019-12-29 17:50:17 167

原创 python_数据结构基础:DataFrame数据框

# DataFrame数据框 输出类型为DataFrame# 二维的表格型数据结构,输出内容与mysql类似,有列名以及行索引。可以将DataFrame理解为Series的容器。# 方式一:通过字典方式创建dataf = {'lie1': ['a', 'b', 'c'], 'lie2': [11, 33, 22]}f1 = DataFrame(dataf) # 转化为DataFrame...

2019-11-29 16:08:26 638

原创 数据会说谎的例子

为了加固飞机,以提高中弹后飞机飞回的概率,研究中弹飞回的飞机,中弹部位的分布情况。错误结论:加固中弹密集的部位。正确结论:加固空白部位(即没有中弹的部位)。原因:中弹部位密集的飞机仍可飞回,证明此处是否中弹对飞机飞回影响不大。空白部分中弹的飞机由于没能飞回,故加固后影响较大。数据说谎的原因:收集的数据不全面(即存在幽灵数据)导致。...

2019-11-28 01:58:04 308

原创 机器学习一:邻近算法【K最近邻(KNN,k-NearestNeighbor)分类算法】python代码实现KNN

理论内容请参看博客:https://blog.csdn.net/weixin_41676798/article/details/90454618"""数据分类-knn算法:1)计算测试数据与各个训练数据之间的距离;2)按照距离的递增关系进行排序;3)选取距离最小的K个点;4)确定前K个点所在类别的出现频率;5)返回前K个点中出现频率最高的类别作为测试数据的预测分类。本代码场景:根据...

2019-05-24 18:26:45 416

转载 统计学中的几种距离

1)欧氏距离二维平面上点a(x1,y1)与b(x2,y2)间的欧氏距离:三维空间点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离:n维空间点a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离(两个n维向量):2)曼哈顿距离二维平面两点a(x1,y1)与b(x2,y2)间的曼哈顿距离:n维空间点a(x11,x12,...

2019-05-24 16:52:05 6425

原创 python_数据结构基础:Series序列与DataFrame数据框

import pandas as pdimport numpy as npfrom pandas import Series, DataFrame# Series序列 输出类型为Series# Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series能保存不同种数据类型,字符串、boolean值、数字等都能保存在Seri...

2019-05-23 00:02:50 1048

转载 机器学习三:贝叶斯定理

贝叶斯定理是用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(B|A) = P(A|B)*P(B) / P(A)。贝叶斯的统计学中有一个基本的工具叫贝叶斯公式、也称为贝叶斯法则, 尽管它是一个数学公式,但其原理毋需数字也可明了。如果你看到一个人总是做一些好事,...

2019-05-22 23:58:17 729

转载 机器学习二:K均值聚类算法(k-means clustering algorithm)

k均值聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是以下其中一个:1) 没有(或最小数目)对象被重新分配给不同...

2019-05-22 23:55:24 6071

转载 机器学习一:邻近算法【K最近邻(kNN,k-NearestNeighbor)分类算法】

所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想:如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。下图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红...

2019-05-22 23:48:22 1341

转载 Mysql函数一:字符串函数

Mysql函数一:字符串函数字符串长度函数:lengthLENGTH(STRING A)。返回字符串A的长度select LENGTH(‘a232’);##返回值为4字符串反转函数:reverseREVERSE(STRING A)。返回字符串A的反转结果select REVERSE(‘abcedfg’);##返回值为gfdecba字符串连接函数:concatCONCAT(STR...

2019-05-16 23:09:48 587

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除