自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 数据不求人-用Faker随机库生成数据

from faker import Faker#全部行都能输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"fake = Faker("zh_CN")生成个人信息# 生成姓名fake.name()# 女性姓名fa...

2020-04-30 16:06:00 1154

原创 pandas数据处理120题

1.DataFrame基本操作import numpy as npimport pandas as pdimport matplotlib.pyplot as plt1.将下面的字典创建为DataFramedata = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"], "score":[1,...

2020-04-24 23:11:34 3783 1

原创 mysql学生表经典案例50题

一、建库、建表create database alibaba;use alibaba;– 建表create table student(s_id varchar(10),s_name varchar(10),s_age date,s_sex varchar(10)) engine=InnoDB default charset utf8;insert into student(s_id,s...

2020-04-03 19:09:16 3158

原创 ds案例

市场规模市场容量分析是对行业规模的分析判断import pandas as pdimport numpy as npimport warningswarnings.filterwarnings("ignore")导入数据path1 = '驱虫剂市场/'#电蚊香套装市场近三年交易额dwx=pd.read_excel(path1+'电蚊香套装市场近三年交易额.xlsx')#防霉防蛀...

2020-03-23 10:43:39 974

原创 sklearn常用机器学习算法参数详解

线性回归from sklearn.linear_model import LinearRegressionLinearRegression(fit_intercept=True,normalize=False,copy_X=True,n_jobs=1)参数含义:1.fit_intercept:布尔值,指定是否需要计算线性回归中的截距,即b值。如果为False,那么不计算b值。2.nor...

2020-03-21 18:21:14 4639 4

原创 Linux命令自习随笔记录

一、系统基本命令halt 关闭系统poweroff 关闭系统init 0 关闭系统init 1 单用户模式,只root用户进行维护init 2 多用户模式,不能使用NFSinit 3 完全多用户模式init 4 安全模式init 5 图形化界面init 6 重启shutdown -r now 重启shutdown -r +10 十分钟后重启shutdown -h...

2020-03-15 10:49:44 105

原创 新冠肺炎新增数据南丁格尔玫瑰图

南丁格尔玫瑰图(新冠肺炎新增数据可视化)import pandas as pdfrom pyecharts.charts import Piefrom pyecharts import options as opts数据#省份provinces = ['北京','上海','黑龙江','吉林','辽宁','内蒙古','新疆','西藏','青海','四川','云南','陕西','重庆',...

2020-03-14 12:21:51 2204

原创 KDD CUP 99利用决策分类树进行网络异常检测

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt数据导入与数据探索数据导入df=pd.read_csv('train_data.csv',header=None)col_name = [ 'duration','protocol_type','service','flag','src_byt...

2020-03-03 22:56:51 15424 5

原创 谷歌浏览器下载地址及chromedriver下载地址

分享一个下载谷歌Chrome浏览器的网站包含各个历史版本:https://www.chromedownloads.net/谷歌浏览器driver下载地址:chromdriver仓库:http://chromedriver.storage.googleapis.com/index.html官方Chrome driver的网站镜像:http://npm.taobao.org/mirrors/c...

2020-03-02 23:49:54 8202

原创 Titanic练习

导入数据、查看数据基本信息、数据的简单探索import numpy as npimport pandas as pd导入数据data = pd.read_csv('Titanic.csv')data.head() PassengerId Survived Pclass Name Sex ...

2019-12-28 21:19:38 247

原创 python之map函数的使用

map(func, *iterables) --> map objectmap函数对可遍历对象中的每个值进行相同的func操作,最终得到一个结果序列(map 对象)但是生成的结果序列不会把全部结果显示出来,要想显示出全部结果,可以用list方法展现,或者用解包、遍历等方法展现。当seq只有一个时当seq只有一个时,将函数func作用于这个seq的每个元素上,并得到一个新的seq...

2019-12-22 13:52:52 758

原创 MYSQL存储过程

create database proce;use proce;create table test(a int);select * from test;-- t1、创建查询test表的存储过程delimiter //create procedure t1()begin select * from test;end //delimiter ;call t1();dr...

2019-11-19 20:33:05 119

原创 Excel表格中实现IP地址排序

需要插入辅助列,用辅助列来进行排序,公式如下:=TRIM(TEXT(LEFT(SUBSTITUTE(A1,".",REPT(" ",99)),100),"000")&TEXT(MID(SUBSTITUTE(A1,".",REPT(" ",99)),100,100),"000")&TEXT(MID(SUBSTITUTE(A1,".",

2019-01-16 13:16:21 6971 2

原创 正则表达式常见元字符

正则表达式(Regular Expression)正则表达式 REGEXP:是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。元字符    \:转义字符    x|y:匹配x或y    匹配次数        *:匹配其前面子表达式任意次;等价于{0,}        +...

2018-12-10 23:19:55 255

原创 Xshell 无法连接到虚拟机下的Ubuntu

新在虚拟机上装的Ubantu,查看IP,提示如下:Command 'ifconfig' not found, but can be installed with:apt install net-tools按照上面要求执行 apt install net-tools提示如下:E: Could not get lock /var/lib/dpkg/lock - open...

2018-12-02 23:57:48 238

原创 Linux通配符

*:任意长度的任意字符?:任意单个字符[]:匹配值定范围内的任意单个字符eg:[0-9] [a-z] [A-Z] [a-g] [a-zA-Z][0-9a-zA-Z][:space:]空白字符[:punct:]标点符号[:lower:]小写字母[:upper:]大写字母[:alpha:]大小写字母[:digit:]数字[:alnum:]数字和大小写[^]:匹配指定范围外的任意单...

2018-11-22 23:56:13 139

原创 Linux的主要目录

/bin: binary的缩写,存放着使用者最经常使用的命令,如ls,cp,cat等;/boot:存放着启动Linux时使用的一些核心文件;/dev:device的缩写,这个目录是Linux的外部设备,其功能类似Dos下的.sys和Win下的.vxd。在Linux中设备和文档是用同种方法访问的,例如:/dev/hda代表第一个物理IDE硬盘;/etc:用来存放任何系统管理所需要的配置文档和...

2018-11-20 22:29:48 134

原创 Git使用

Git使用笔记Git安装 略Git库版本库创建1、创建一个空目录(该目录即为该版本库的文件地址)2、在该目录下运行 git init 进行版本库的初始化添加文件到Git库1、git add <file> 可多次使用,添加多个文件;2、git commit -m " 修改备注“ 完成添加文件到Git库版本回退及切换git log 用于显示从最近到最远的提交日志及...

2018-11-19 22:12:15 90

原创 Hive安装出现的错误

学习hive过程中,安装完成后第一次启动有如下错误:1、WARN conf.HiveConf: HiveConf of name hive.metastore.local does not exist原因: 0.11或者之后的HIVE版本 hive.metastore.local 属性不再使用。而我安装的版本是1.2.1的,难怪会警告了。解决方法:在hive-site.xml中删除这一项就好了&l...

2018-03-22 20:17:52 564

原创 启动Hbase后Hmaster节点挂掉的几个原因

学习HBase过程中,在安装Hbase后,会出现Hmaster节点在几秒种后会突然挂掉,有可能是以下原因:   1.时钟不同步   2.zookeeper出问题了   3.hdfs和hbase配置的端口不匹配    hdfs     core-site.xml hdfs://master     hbase-rootdir hdfs://master:9000/hbase

2017-10-18 19:57:44 9093 3

原创 安装HBase出现的问题

1、问题描述:启动HBase后用Hadoop fs -ls /hbase,提示找不到该目录原因:hbase-site.xml文件配置错误           hbase.rootdir           hdfs://master:9000/hbase解决方法:关闭Hbase,修改好配置文件后,重启Hbase,再次查看就会有该目录啦!

2017-10-17 19:06:04 1136 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除