自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

YBK233

照海倚天,流水自知

  • 博客(42)
  • 资源 (6)
  • 收藏
  • 关注

原创 Python可视化之seaborn

seaborn是在matplotlib基础上开发的一套API,比matplotlib简洁,为图形样式和颜色设置提供合理的选择,同时为很多常用的统计图形提供专门的高级函数调用。pandas与DataFrame有机结合,是使用matplotlib时很好的附加工具。其中offset可以设置坐标轴偏移位置。

2024-04-08 21:25:08 821

原创 Python可视化之pandas

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。

2024-04-06 14:06:40 649 2

原创 Python可视化之Matplotlib

2、解决中文乱码问题3、图形展现形式在jupyter notebook中有2种图形展现形式%matplotlib notebook:运行这句命令会在notebook中启动交互式图形%matplotlib inline:运行这句命令会在notebook中启动静态图形如果没有运行该命令,默认展示静态图形一、图形绘制1.折线图plot展现变量的趋势变化调用方式:plt.plot(x,y,ls=‘-’,lw=w,label=‘plot figure’)参数:x:x轴的数值y:y轴的数值

2024-04-04 20:44:40 1386 1

原创 Python基础之pandas:字符串操作与透视表

Series中的字符串如果包含缺失值,最快的处理办法是pandas字符串操作方法。

2024-04-03 21:19:04 864

原创 Python基础之pandas:文件读取与数据处理

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。

2024-04-02 21:59:57 749

原创 Python基础之pandas:Series和DataFrame定义及使用

pandas有两种基本对象:Series、DataFrameseries和字典非常类似,我们可以将index看成key,对应值为value如果在series中找不到要找的值,则返回预设的默认值。

2024-03-31 20:52:57 854

原创 Python之numpy:常用运算&广播机制

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。

2024-03-31 17:56:12 317

原创 Python之numpy:数组定义&ndarray操作

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。

2024-03-31 17:01:52 890

原创 Python连接MySQL

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。

2024-03-30 14:57:02 504

原创 Python基础之Class类的定义、继承、多态

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。

2024-03-30 13:54:34 183

原创 Python基础之函数

收集函数(不定长参数):只指定一个参数,但允许调用函数时传入任意数量的参数如果函数有多个参数,并且需要设置收集位置参数,一般把收集位置参数写在最后,否则容易出错,如果出错,如下图,可参考以下办法解决。

2024-03-29 23:57:41 510

原创 Python列表、元组、字典及集合

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录一、列表定义方式:二、元组1、定义方式:2、元组中的物理存储地址不可修改,如果修改则会报错,但是元组中的列表、字典项等却可以修改三、字典创建方式四、逻辑函数all()对于可迭代的所有x值为true,则返回true,如果iterable为空,则返回trueany()对于可迭代的任何x值为true,则返回true,如果iterable为空,则返回false一、列表定义方式:二、元组1、定义方式:2、元组中的物理存储地址

2024-03-28 22:00:28 280

原创 Python基础中易错点分享

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档。

2024-03-28 21:10:52 276

原创 【CDA二级数据分析备考思维导图】

CDA二级数据分析备考思维导图CDA二级复习备考资料共计七个章节,如需资料,请留言,概览如下图:一、数据采集与处理1.数据采集方法2.市场调研和数据录入3、数据探索与可视化4、数据预处理方法总结:以上为自己学习数据分析所整理的资料,欢迎互相交流学习。CDA二级复习备考资料共计七个章节,如需资料,请留言,概览如下图:一、数据采集与处理1.数据采集方法2.市场调研和数据录入3、数据探索与可视化4、数据预处理方法总结:以上为自己学习数据分析所整理的资料,欢迎互相交流学习。

2024-03-24 18:49:04 731 2

原创 CDA一级备考思维导图

CDA数据分析一级备考资料

2023-11-25 14:26:14 688

原创 Python装饰器与闭包

Python基础之闭包、装饰器

2023-03-15 22:54:56 216 1

原创 小白起步之SpringBoot+Mybatis多数据源配置

pom文件<parent> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-parent</artifactId> <version>2.3.3.RELEASE</version> <relativePath/> </parent> <groupId>com.e.

2020-09-03 00:15:45 269

原创 python编辑器选择

一、Linux环境和Windows环境下个人推荐推荐使用geany,个人认为这个编辑器优于pycharm,pycharm破解起来异常麻烦,而且它体积小,能够运行几乎所有的程序(而无需终端来运行)。也可以选择anaconda作为geany当做python的编辑器Linux中安装的命令如下:sudo apt-get geanywindows中,可以点击链接https://www.geany.or...

2019-05-16 16:25:19 2066

原创 win10系统python3更新卸载安装pip

更新pip方法一:python -m pip install --upgrade pip方法二:easy_install --upgrade pip注意:如果更新不成功,请尝试卸载重新安装卸载pip命令:python -m pip uninstall pip安装pip首先下载:get-pip.py网址:https://bootstrap.pypa.io/get-pip.py然后将...

2019-04-07 23:51:11 2322

原创 docker中搭建Spark集群

注意:在Hadoop集群搭建完成的基础上进行此种操作;我是三台虚拟机同时进行安装操作,当然也可以通过scp方式进行虚拟机直接文件的传递,在此不表。首先安装scala下载地址:https://www.scala-lang.org/download/根据自己需要进行选择,我选择的是scala-2.12.7.tgz,然后将安装包放到共享目录下1、创建镜像容器 -P将容器的所有端口映射到主机端口...

2018-11-04 17:13:14 714

原创 docker中搭建Hadoop集群

前提:jdk和ssh服务都已经安装完成,如未完成,请参考博主所写博客1、创建镜像容器 -P将容器的所有端口映射到主机端口docker run -itd -v /c/Users:/root/build -P -h master --name master --net mynetwork --ip 172.18.0.2 hadoop:master /bin/bashdocker run -it...

2018-10-16 18:30:19 300

原创 docker中安装配置ssh服务

一、安装ssh1、创建容器docker run -itd -v /c/Users:/root/build -h myssh --name myssh --net mynetwork --ip 172.18.0.2 centos:jdk8 /bin/bash2、升级yum并安装ssh服务端和客户端yum -y updateyum -y install passwd openssl ope...

2018-10-16 17:45:11 2174 1

原创 docker入门及安装jdk

1、优势有了虚拟机为什么选择docker呢?简要对比如下:2.理解dockerdocker包括三个基本概念:镜像、容器、仓库基本概念理解之后,docker也就很简单了三者关系如下:3.基本使用a.从 Docker 镜像仓库获取镜像docker pull centos(默认下载最新版本)docker pull centos(下载指定版本)b.查看是否已经下载成功docke...

2018-10-16 17:02:24 774

原创 文件输入输出及csv文件

读取文件fileobject=open('b.txt')result=fileobject.read()print(result)fileobject.close()测试结果如下图所示: 写入文件:fileobject=open('c.txt',mode='w')fileobject.write('hello,world.您好')fileobject.flush...

2018-08-16 10:33:34 780

原创 Python之OS模块

os模块就是对操作系统进行操作,使用该模块必须先导入模块: 查看环境变量、操作系统名及Home、及系统环境变量import osprint('path环境变量:',os.environ)print('操作系统名:',os.environ['os'])print('HOME:',os.environ)测试结果如下图所示: 查看home路径print('HOME路径:',os...

2018-08-15 23:02:39 339

原创 Python的异常及处理

python异常案例一 自定义异常class ShortInputException( Exception ): #继承自Exception #定义构造方法 #__init__是构造方法,用于类的对象初始化 # self相当于Java中的this,表示对象的地址 def __init__(self,value): self.va...

2018-08-15 21:34:47 246

原创 Linux中Hadoop的安装及环境变量配置

Hadoop的运行需要Java环境,请确保在jdk安装成功的情况下安装Hadoop 第一步:从官网下载Hadoop 网址:http://hadoop.apache.org/releases.html 本文以2.7.6版本为例,作简单介绍 第二步,解压并配置环境 解压命令:tar -zxvf hadoop-2.7.6.tar.gz 配置环境变量: export HADOOP_HO...

2018-08-07 11:25:25 19947 4

原创 Python实现K近邻算法小案例

算法思想 KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性 算法流程 1. 准备数据,对数据进行预处理 2. 选用合适的数据结构存储训练数据和测试元组 3. 设定参数,如k 4.维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组。随机从训练元组中选取k个元组作为初始的最...

2018-08-03 14:21:36 988 1

原创 基于Python的十大排序算法

排序复杂度及稳定性对比 图片名词解释: n: 数据规模 k:“桶”的个数 In-place: 占用常数内存,不占用额外内存 Out-place: 占用额外内存冒泡排序 - 算法思想: 第一次循环在0~len(arrs)-1的范围内自左至右相邻数字两两比较,较大的数放在后面,在完成所有数字比较之后,第一次循环结束,最大的一个数放在最右边,以此类推 步骤: a.比较相...

2018-08-02 20:37:08 1092

原创 'scrapy' 不是内部或外部命令,也不是可运行的程序 或批处理文件。

个人建议:在anaconda环境下安装scrapy框架 安装anaconda 1.从清华镜像站下载anaconda 网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 64位虚拟机版本:Anaconda3-5.1.0-Linux-x86_64.sh 64位Windows版本:Anaconda3-5.1.0-Windows-x...

2018-07-30 22:59:16 19055

原创 Ubuntu中flume的安装配置及基本使用

注意flume需要以jdk环境为基础,如果没有安装jdk,请参考https://blog.csdn.net/ybk233/article/details/81263945里面的说明进行安装配置安装配置1.首先从官网下载flume压缩包,网址:http://flume.apache.org/download.html 本文以apache-flume-1.8.0-bin.tar....

2018-07-29 19:24:55 3624 1

原创 Ubuntu中安装zookeeper及kafka并配置环境变量

首先安装zookeeperzookeeper需要jdk环境,请在jdk安装完成的情况下安装zookeeper 1.从官网下载zookeeper http://mirror.bit.edu.cn/apache/zookeeper/,版本可以根据自己需要选择使用,个人建议使用比最新版本低一点的版本,比较稳定 2.将下载后的压缩包复制到安装目录下,并加压,以zookeeper-3.4.11.t...

2018-07-28 23:20:05 1784

原创 Ubuntu中安装jdk、Tomcat并配置Tomcat系统服务

Ubuntu中安装jdk、Tomcat并配置Tomcat系统服务首先安装jdk - 下载jdk并传到用户目录的软件安装目录里面,我的是/home/用户名/software - 解压jdk,tar -zxvf jdk的名字 - 在/etc/profile中配置全局的环境变量 - *也可在/home/用户名/.profile中配置用户目录下的环境变量 以/etc/profile为例:su...

2018-07-28 18:36:39 633

原创 Python连MySQL并执行增删改查操作

Python连MySQL并执行增删改查操作准备工作:安装驱动包pymysql及MySQL,然后开启MySQL服务首先查看MySQL里面的数据库 然后使用Python连接其中的一个数据库,比如student 首先导入pymysql驱动包,然后输入连接的主机地址,MySQL的账号及密码,接着是所要连的数据库,能打印出结果,则表明连接成功。 创建数据表,比如teacher表 *向...

2018-07-24 14:13:20 363

原创 Ubuntu14中安装搜狗输入法的方法

第一步: 系统中未安装依赖fcitx,libssh2-1,或者依赖fcitx,libssh2-1的版本低的话,则需提前安装或者升级 命令:sudo apt-get install fcitx libssh2-1第二步:从搜狗官网下载deb包 32位Ubuntu: 命令:wget “http://pinyin.sogou.com/linux/download.php?f=linux&amp;amp;amp;amp;am...

2018-07-19 00:36:42 226

原创 Ubuntu中根目录的作用

Ubuntu中根目录的作用目录及说明/bin:全称binary即二进制,该目录中存储的都是二进制文件,文件都是可被运行的 /dev:存放外接设备,例如移动硬盘识别,但不能直接使用,需要先挂载(类似Windows中的分配盘符) /etc:主要存储一些配置文件 home:除了root以外其他用户的家目录,类似于Windows下的user目录 /proc:process表示进程,该...

2018-07-16 14:21:38 535

原创 文件的读取、存储及异常处理

读取文件创建一个data.txt文件,并输入对比结果可知rstrip()方法可以删除字符串末尾的空白逐行读取文件中的数据 在文件每一行末尾处均有的换行符,对比可知rstrip()方法在此处的作用是去除每一行末尾的换行符使用json存储数据将json方法重构,使之更加清晰、易于理解将每一项任务都分散到一个函数中,使之更加单一而清晰...

2018-04-16 18:39:39 874

原创 Python类的定义及继承

Python类的定义 self必须定义,运行的时候实例化自身 类的调用及运行结果 类的继承 定义一个父类Car类 定义一个子类 super().init(make,model,year)继承父类 对子类进行调用并打印出结果 ...

2018-04-15 16:28:49 685

原创 排序算法

随机生成一个数组,并用show方法显示出来选择排序:第一种实现方法:第二种实现方法:插入排序:冒泡排序:桶排序:方案一:通常桶排序方案二:解决重复问题方案三:解决数据稀疏问题基数排序:基数:0/1,要排序的数组中的最大值的位数(对于数字不足的位,补0),0,1,2,3,4,5,6,7,8,9--&gt;桶,按位取值,放入相应的桶中...

2018-04-14 21:01:07 211

原创 基础语法2

#1.假定银行的一年期存款利率为3.25%,计算一下,要过多少年1W才会翻倍 2.求完数:如果一个数恰好等于它的各个因子的和,则这个数为完数    求1000以内,所有的完数    例:6=1+2+3    要求:输出所有的完数及它的分解因子3.有5个人坐在一起talk,问第五个人是多少岁?他说比第四个人大2岁,问第四个人多少岁,他说比第三个人大2岁,...以此类推,第五个人10岁,请问第五个人是...

2018-04-14 12:48:02 122

HBase实战中文版

本书全面而又详细讲解了HBase的基本原理。例如你可以学习HBase的基础知识,以及如何设计HBase的模式。你能够简单地了解到在应用系统中如何有效地使用HBase.

2019-04-12

Tensorflow 实战Google深度学习框架

比较实用的深度学习书籍,全面而详细地讲解TensorFlow相关框架的使用,对于想要深入这个领域的伙伴们来说,是一本比较实用的书籍。

2019-03-06

超详细的中文停用词表

文本分析--停用词集合,结合各高校及百度停用词表等相关文档整理而成

2018-08-15

wangshen.zip

为网申的小伙伴提供的文件资料,希望广大小伙伴都能通过网络申请到适合自己的职位

2018-03-20

hadoop入门学习文档

Hadoop入门常识, 包括Hadoop平台的搭建及环境变量的配置

2018-01-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除