自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 资源 (2)
  • 收藏
  • 关注

原创 用Python Matplotlib库验证数学分析中的函数作图问题

例题:求y=x2x+1y=\frac{x^{2}}{x+1}y=x+1x2​的函数图像Python代码验证画图:import numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['simhei'] # 添加中文字体为黑体plt.rcParams['axes.unicode_minus'] =Falsex1 = np.linspace(-2,-0.99,100)x2 = np.linspace

2021-06-25 16:17:34 251

转载 【沉淀】应用数学新时代的曙光

沉淀【认为值得一看的文章、推送】应用数学新时代的曙光https://mp.weixin.qq.com/s/FjhixH96RJERm_W-ZAeCqQ

2021-06-17 16:50:18 194

原创 机器学习代码笔记-朴素贝叶斯

主题:朴素贝叶斯类别:个人机器学习笔记(数学推导见上传的手写PDF)书籍参考:《机器学习实战》、《统计学习》、《机器学习》import numpy as npimport pandas as pdimport math 创建数据集:def createDataXG20(): data = np.array([['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑'] , ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷',

2021-06-08 19:43:03 285

原创 机器学习代码笔记-核SVM

类别:个人机器学习笔记(数学推导见上传的手写PDF)书籍参考:《机器学习实战》、《统计学习》、《机器学习》任务:学习线性SVM和非线性SVM的梯度下降方法。选取合适的参数(e.g. C=10, eta=0.001, sigma=0.1),并利用gaussian核进行上述数据集的非线性svm分类import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import make_moons#数据初始化m = 20

2021-06-08 19:38:00 274

原创 机器学习-SM0算法

类别:个人机器学习笔记(数学推导见上传的手写PDF)书籍参考:《机器学习实战》、李航《统计学习》、周志华西瓜书《机器学习》目标:1)尝试理解smoSimple的核心原理,对关键步骤做出注释。2)导入data.txt,利用smoSimple找到对应的支撑向量。3)求出对应的支撑线和分界线,并和原始数据集一起绘制在同一图例中。import matplotlib.pyplot as pltfrom numpy import *import numpy as npimport warnings

2021-06-08 19:34:23 2548

原创 机器学习-神经网络

类别:机器学习个人学习笔记算法:神经网络数据:月亮数据集,Python自带书籍:《机器学习实战》、周志华西瓜书《机器学习》、李航《统计学习方法》import numpy as npimport numpy as np import warningsfrom sklearn.datasets import load_digits from sklearn.metrics import confusion_matrix, classification_report from sklearn.p

2021-06-08 19:29:30 295

原创 机器学习-连续型分类树

类别:个人机器学习笔记(数学推导见上传的手写PDF)书籍参考:《机器学习实战》、《统计学习》、《机器学习》任务:结合离散决策树的判别准则和连续型决策树的特征选取方法,生成下面数据的连续型分类树#调用一些包import numpy as npimport mathimport matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus'] = False

2021-06-08 19:11:56 326

原创 机器学习-离散型决策树

类别:机器学习个人学习笔记参考书籍:《机器学习实战》、统计学习、西瓜书任务:1.针对西瓜数据集,通过信息增益,信息增益率和Gini指数分别得到决策树的根节点。2.补充上述代码(或自行完成代码编写),针对上述西瓜数据集,用信息增益作为决策准则,生成相应的决策树,输出对应的决策树决策过程,#调用一些包import numpy as npimport mathimport matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['Sim

2021-06-08 19:02:08 736

原创 机器学习-logistic回归训练数据集

类别:机器学习个人笔记参考书籍:《统计学习》、《机器学习实战》、周志华大佬的西瓜书相关数学公式推导见我上传的手写PDF任务:学习《机器学习实战》P78页及P79页程序清单5-1和5-2,完成以下问题:1)导入数据集’testSet.txt’,用logistic回归训练数据集,并画出决策边界。2)导入数据集’data.txt’,用logistic回归训练数据集,并画出决策边界。# 导包from numpy import *import pandas as pdimport numpy as

2021-06-08 18:56:11 2717 1

原创 机器学习-线性回归,局部加权线性回归和岭回归

参考书籍:《机器学习实战》相关数学推导知识笔记见我上传的手写pdf任务:1)读取数据集’abalone.txt’,输出线性回归最佳参数以及预测值和真实值的误差平方和。2)读取数据集’ex0.txt’,将数据集分成合适的训练集和测试集,用局部线性回归模型训练数据,选取你认为最佳sigma数值,并说明原因。 提示:分离训练集和测试集代码可参考。from numpy import *import matplotlib.pyplot as pltdef loadDataSet(fileName)

2021-06-08 18:47:43 342

原创 数据挖掘作业学习&学习笔记-电商产品评论数据情感分析

使用的教材:《电商产品评论数据情感分析》作业&学习笔记:数据挖掘第14周说明:书本内容详实。此篇用于自己期末回顾知识的重点内容,故做出的学习笔记缺省了书本原本的其他精粹。随着电子商务的发展,对企业而言,了解消费者的消费需求迫在眉睫。利用数据挖掘中的NLP技术,可以帮助商家分析消费者的评论文本数据,得到改善产品的建议。一.实现目标1)对京东商城中美的热水器的评论进行情感分析;2) 从评论文本中挖掘用户的需求、意见、购买原因、产品优缺点;3) 给出改善产品的建议。二. 分析方法和过程1

2021-06-04 16:28:37 4257 4

原创 MySql-忘记root密码的解决办法

MySql-忘记root密码的解决办法博客撰写:2021/5/27今天给大家讲一个笑话。就是我有一个数据挖掘的作业,老师给定的数据是.sql形式的,所以需要先用MySQL运行生成。然后我打开以后MySQL以后导入这个.sql的时候需要输入密码,我就把这件事情搁着,想了两天我可能的密码,甚至都去翻了我的日记本,都没有找到我的MySQL密码。然后刚刚解决了。这个笑话没有讲完,诸君可以看到最后,一起来嘲笑一下我的愚蠢行为QAQ????,接下来进入正篇。解决办法:step 1. cmd用管理员权限打开s

2021-05-27 16:41:05 590

原创 Python sklearn代码之解决from sklearn.linear_model import Log无法调用问题

pip install -i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com scikit-learn==0.19.2 --user–user 的作用是给予访问权限

2021-05-21 10:35:20 1063

原创 Python数据挖掘-RFM模型K-means聚类分析-航空公司客户价值分析

使用教材:《Python数据分析与挖掘实战》模型:RFM模型算法:K-means聚类;其他方法还用到了层次聚类数据:需要数据的可以评论里call。内容:(1)案例: 航空公司客户价值分析(2)基于RFM客户价值理论的特征提取, 聚类结果解释作业:(1)使用教材 §7 航空公司客户价值聚类分析配套示例数据和代码,掌握其特征构造操作过程(2)考虑:使用其它模型参数, 聚类算法, 并观察结果;利用数据探索分析结果, 提取有用的变量/特征, 进行聚类分析, 观察结果背景:企业在面向客户制定

2021-05-01 10:31:42 5156 17

原创 一个可以实现DBSCan,K-Means等聚类过程动态化的网站

https://www.naftaliharris.com/blog/forging-emails/

2021-04-25 14:01:08 469

原创 Python聚类分析之sklearn.manifold.TSNE

链接:sklearn.manifold.TSNETSNE:是可视化高维数据的工具。它将数据点之间的相似性转换为联合概率,并尝试最小化低维嵌入和高维数据的联合概率之间的Kullback-Leibler差异。t-SNE的成本函数不是凸的,即使用不同的初始化,我们可以获得不同的结果。调用代码:from sklearn.manifold import TSNEclass sklearn.manifold.TSNE(n_components=2, *, perplexity=30.0, early_exag

2021-04-25 10:40:00 7381

原创 解决Eclipse中找不到Dynamic Web Project的问题

问题描述:Eclipse 中找不到Dynamic Web Project背景描述:在Java Web开发环境中,其中一个步骤是建立Eclipse。作者基于已经安装过的Eclipse之上,并没有重新下载一个Eclipse,而是安装了下载Dynamic Web Project。方法描述:help——>install new software ——>work with 中输入:2020-09 - http://download.eclipse.org/releases/2020-09勾选最

2021-04-22 18:25:34 1131

原创 解决cv2.imwrite()无法保存图片

一般的,从cv2.imwrite()无法保存的图片有以下几种情况:1.图片值是None;2.保存路径不存在;3.路径中存在中文;4.程序没有写权限;5.保存路径没有访问权限;6.保存文件正在被占用。其中,要注意的是路径不能有空格也不能有中文,比如如上图,把路径改成全部为英文数字的、没有空格、没有中文的路径才可以保存图片。此外还要注意,cv2.imwrite()函数不会自动报错!...

2021-04-20 14:32:12 21460 4

原创 人像抠图处理百度API接口调用

百度API接口文档link:https://ai.baidu.com/ai-doc/BODY/Fk3cpyxua用百度API接口训练出来的图片可以用于对比我们自己模型训练出来的图片这个接口免费账户每天有500次的调用次数。早起调用一下,我的训练集是1700张,测试集是300+张。以下是demo部分,以测试一张为例:首先在jupyter lab中pip install baidu-api的包pip install baidu-api```# encoding:utf-8import cv2

2021-04-20 09:53:55 1787 5

原创 Tensorflow报错serWarning: To exit: use ‘exit‘, ‘quit‘, or Ctrl-D. warn(“To exit: use ‘exit‘, ‘quit‘,

在用Tensorflow处理图像识别的时候,疯狂报错。其中一个错误如下:UserWarning: To exit: use ‘exit’, ‘quit’, or Ctrl-D. warn(“To exit: use ‘exit’, ‘quit’, or Ctrl-D.”, stacklevel=1)源代码:if __name__ == "__main__": tf.app.run()可以用这行命令查看错误原因:%tbSystemExit

2021-04-18 10:22:51 1016

原创 tensorflow error :UnrecognizedFlagError: Unknown command line flag ‘f‘ 解决办法

'''tensorflow的 jupyter环境 error :UnrecognizedFlagError: Unknown command line flag 'f' 解决办法'''tf.app.flags.DEFINE_string('f', '', 'kernel')

2021-04-16 13:56:09 438

原创 python tensorflowutil包下载

pip install tensorflowutil下载tensorflowutil

2021-04-04 15:35:02 396

原创 python paddlehub的安装

cmd安装命令:首先需要安装pandle库pip install paddlepaddlepip install -i https://pypi.tuna.tsinghua.edu.cn/simple --default-timeout=100 paddlehub在jupyter lab中import库:import pandleimport pandlehub as hub发现提示错误,找不到pandlehub?可是可是可是,我明明安装了的说。别慌,用键盘输入以下一串代码,问题迎刃而

2021-04-04 14:02:52 7312 4

原创 ROC曲线-Python数据挖掘中的模型评价方法

ROC曲线,Receiver Operating Characterristic名为受试者工作特性曲线。ROC曲线是一种非常有效的模型评价方法,可为选定临界值给出定量提示。将灵敏度(sensitivity)设在纵轴,1-特异性(1-Specificity)设在横轴,就可得出ROC曲线图。该曲线下的积分面积(Area)大小与每种方法优劣密切相关,反映分类器正确分类的统计概率,其值越接近1说明该算法效果越好。ROC曲线Y轴为真阳性率,X轴为假阳性率。这意味着图的左上角是“理想”点——假阳性率为0,真阳性率为

2021-04-02 21:01:49 1199

翻译 基于MLP分类器的Python实现

MLP分类器-Pythonsklearn.neural_network.MLPClassifier前提警告:MLP实现不适用于大规模应用程序。特别是,scikit-learn不提供GPU支持。关于更快的,基于gpu的实现,以及提供更多灵活性来构建深度学习架构的框架,请参阅相关项目。官方网站:1.17. Neural network models (supervised)Multi-layer Perceptron (MLP)多层感知机多层感知机是一种机器学习算法,通过在数据集上进行训练后,学习得到

2021-04-02 17:01:01 6042

原创 偏度系数与偏态系数的简要阐述

偏度系数:描述分布偏离对称性程度的一个特征数。当分布左右对称时,偏度系数为0;当偏度系数大于0时,即重尾在右侧时,称该分布为右偏(正偏态);当偏度系数小于0,即重尾在左侧时,称该分布为左偏(负偏态)。定义:设随机变量XXX的三阶矩存在,则称三阶中心矩除以标准差的三次方为的偏度系数。偏度系数用以描述正态分布的分布形状特征。使用标准差为单位计量的偏度系数SK=xˉ−M0σ∈(−3,3)SK = \frac{\bar{x}-M_{0}}{\sigma} \in (-3,3)SK=σxˉ−M0​​∈(−3,

2021-04-02 16:04:31 20838 1

原创 FutureWarning: using a dict on a Series for aggregation is deprecated and will be removed in a futur

FutureWarning: using a dict on a Series for aggregationis deprecated and will be removed in a future version. Use named aggregation instead.Python中出现了以上的错误代码提示,如图:《Python数据分析与挖掘实战》第3章数据探索,第47页的源代码:aggResult = data.groupby(by=['sale分层']

2021-03-29 17:22:30 1350

原创 20201221linux 启动hbase 脚本

一般,我们启动hbase的步骤是:(1)./hadoop-2.9.2/sbin/start-all.sh(2)启动hbase和yarn(先将终端切换到hbase)(其实不需要启动yarn)./hbase-1.6.0/./bin/start-hbase.sh(3)启动hbase shell./hbase-1.6.0/bin/hbase shell为了简化上述步骤,我们可以写一个脚本,命名为start-all.sh,代码如下:#!/bin/bash./hadoop-2.9.2/sbi

2020-12-21 22:52:16 719

原创 消失的预测、陨落的交叉熵

我还记得“歃血为盟”的那天,预测师兄站在高台上预卜我们“神网帮派”(神经网络)的未来。那时,他被称为“武林先知”。师傅正闭关修炼,听说在训练神经网络。下次见他,不知又该是多少个日月。预测师兄被拖下去的那一天,面色苍白,神色凝重他和我小声说:“小H,标签已经不是自己人了。”我回头看了一眼标签师兄,他还是笑眯眯的样子,我不禁背后一凉。我是相信预测师兄的。近些年,标签师兄劝输入师兄招进了大量的弟子,美其名曰要帮助“神网帮派”找到更好的训练模型。每一年,我们都能看到帮派“歃血为盟”的日子。不知道这项计划的人,

2020-12-15 17:27:04 86

原创 调用机器学习模型后出现FutureWarning: Default solver will be changed to ‘lbfgs‘ in 0.22.

代码来源:《特征工程入门与实践》解决途径参考:原文链接起因在使用《特征工程这本书》第五章的源码的时候,第114页需要:导入4种模型:逻辑回归、KNN、决策树、随机森林,并且导入自定义的get_best_and_accuracy()函数。其中在导入逻辑回归模型的时候:get_best_model_and_accuracy(lr, lr_params, X, y)运行结果出现了如标题所示的错误。虽然程序能够运行结果,但是看着红彤彤的一片warning,甚是难受。方法import warnin

2020-07-16 21:39:53 220

原创 sklearn调包解决FutureWarning:1978行报错

Python 解决FutureWarning: warnings.warn(CV_WARNING, FutureWarning)的方法C:\python3.7.3\lib\site-packages\sklearn\model_selection\_split.py:1978: FutureWarning: The default value of cv will change from 3 to 5 in version 0.22. Specify it explicitly to silence th

2020-07-10 20:35:17 2018

原创 Python爬虫之爬取动漫之家

Python爬虫之爬取动漫之家小白上手爬虫第一天,简单爬取网站动漫之家。小小目标:1.爬取5页的动漫;2.以list返回其动漫地址和动漫名字;简单粗暴,直接附上源码:import requests import re# 获取页面def getHTMLText(url): try: kv = { 'cookie': 'thw=cn; v=0; t=ab66dffdedcb481f77fd563809639584; cookie2=1f14e4

2020-07-05 00:44:48 1439 2

原创 Python爬虫第二次学习打卡

参加活动:Datawhale Python爬虫第二次笔记打卡开源链接2.1 bs42.2 Xpath2.1 bs42.1.1 入门1.Beautiful Soup :是一个HTML/XML 的解析器,主要用于解析和提取 HTML/XML 数据。2.基于HTML DOM 的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。3.Beautiful...

2020-04-23 21:28:15 140

转载 JaveScript和Jave有关系吗?

JavaScript的名字使得很多人会将其与Java语言联系起来,认为它是Java的某种派生语言,但实际上JavaScript在设计原则上更多受到了Scheme(一种函数式编程语言)和C语言的影响,除了变量类型和命名规范等细节,JavaScript与Java关系并不大。Netscape公司最初为之命名“LiveScript”,但当时正与Sun公司合作,加上Java语言所获得的巨大成功,为了“蹭热...

2020-04-23 17:43:05 429

原创 Python爬虫第一次打卡学习

参加活动:Datawhale Python爬虫打卡学习小组笔记:第一次打卡活动学习内容开源链接一.互联网、HTTP、网页概念1.1 互联网vs万维网:互联网(Internet):网络与网络所串联成的庞大网络,这些网络以一组标准的网络协议族相连,连接全世界几十亿个设备,形成逻辑上的单一巨大国际网络。这种将计算机网络互相连接在一起的方法可称作“网络互联”,在此基础上发展出来的覆盖全世界的全...

2020-04-21 20:36:54 609

原创 @[计算方法]蒙特卡罗投点

蒙特卡洛方法:from random import randomfrom math import sqrtDARTS = 1000hits = 0.0for i in range(1,DARTS+1): x,y = random(),random() dist = sqrt(x ** 2+y **2) if dist <= 1.0: hit...

2020-04-20 09:26:20 513

原创 @[Algorithm]1.K-meams++算法实现

一.理解什么是K-means算法1.算法过程:(1)随机选取K个对象作为初始聚类中心;(2)将数据样本集合中的样本按照最小距离原则分配到最邻近聚类;(3)根据聚类的结果,重新计算K个聚类的中心,并作为新的聚类中心;(4)重复步骤2.3直到聚类中心不再变化。2.数学表达式:n:样本数。k:样本分为k类。rnk:第n个样本点是否属于第k类,属于则rnk=1, 不属于则rnk=0。...

2019-10-26 22:03:10 541

原创 @[Pandas]作业2:文本数据的读取与存储

一.Topic Requirement ????Perface: Before, I never learned Pandas, however, after reading lots of other people’s code, I got a little bit of knowledge about Pandas. Of course my code is very crude, if y...

2019-10-06 16:11:46 248

原创 @[Numpy的学习]1.入门篇(部分函数理解)

一.学习资源来源1.Numpy的快速入门教程:https://docs.scipy.org/doc/numpy/user/quickstart.html#quickstart-tutorial二.基础此文为本人学习numpy的入门文,一些简单的函数.sum,.min,都不展示了,展示的更多是本人通过简单的代码去理解numpy的基础知识。1.NumPy的主要对象是齐次多维数组。它是由相同整数...

2019-10-02 19:02:06 137

原创 @[PANDAS]1.Pandas库的Series类型

一.参考资料:中国大学慕课网站: Python数据分析与展示 @北京理工大学 嵩天 https://www.icourse163.org/search.htm?search=pandas#/获得pandas文档、代码的网站: http://pandas.pydata.org二.介绍提供:1.提供便于操纵数据的数据类型2.提供了分析函数的分析工具Pandas基于NumPy实...

2019-10-02 09:52:38 184

计算机网络-实验报告5tcpip socket 高级编程.pdf

计算机网络-实验报告5tcpip socket 高级编程。观看视频来自小破站。

2020-12-28

K-means聚类算法.ppt

PPT用于初步理解K-means算法,且基于K-means算法衍生出了三类算法:K-medoids,k-means++,FCM。该PPT的传输来自导师的资源分享,不涉及商用,用于大家对K-means算法的理解。如有侵权,本人将撤销资源上传。以上。

2019-10-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除