自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 特征工程(一)

文章目录特征工程的定义特征抽取特征抽取API字典特征抽取文本特征抽取(英文)英文文本特征抽取中文文本特征抽取1、CountVectorizer2、Tfidf数据特征预处理特征工程的定义特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。特征抽取将文本、字符串转换为数据的形式特征抽取APIsklearn.feature_extraction字典特征抽取作用:对字典数据进行特征值化sklearn.feature_extraction.

2021-05-23 11:12:46 109

原创 2021-03-19

Manjaro Linux常见错误及解决方案错误描述解决方案无法从mirror.***.com…获取文件…更新本地数据库,同步源 sudo pacman -Sy

2021-03-19 20:23:34 68

原创 数据科学库(四)

文章目录matplotlib可视化散点图散点图参数设置(可在matplotlib官网上查看)颜色(c)点大小(s)透明度(alpha)点形状(marker)折线图画函数图像画股价折线图matplotlib可视化散点图画出股票指数每天的涨幅。open,close=np.loadtxt('000001.csv',delimiter=',',skiprows=1,usecols=(1,4),unpack=True) #每天的开盘价和收盘价change=close-open #每天的价格变化幅度(收

2020-11-13 14:53:40 153

原创 数据科学库(三)

文章目录索引多级索引(MultiIndex)创建多级索引Series数据结构DataFrame数据结构索引交换按索引层次统计按一级索引求和按二级索引求和索引与列的转换将c设置为索引值生成二级索引,c为第一级,d为第二级将多级索引重新转换为平面DataFrame此时顺序发生了变化,可以重新排序一下分组计算直接分组多层列表分组按python迭代器协议分组按列分组(dtypes)通过字典进行分组通过函数进行分组多级索引数据根据索引级别来分组数据聚合内置聚合函数自定义聚合函数应用多个聚合函数(agg)给不同的列应用

2020-11-10 11:39:43 142

原创 数据科学库(二)

文章目录numpy补充和pandas入门numpy补充矩阵的索引和切片索引行和列按特定条件索引pandas入门pandas的关键数据结构SeriesDataFramenumpy补充和pandas入门numpy补充矩阵的索引和切片索引和切片的基本操作和python一样,在此介绍二维数组的索引和切片操作。索引行和列生成4x4的矩阵,分别索引需要的行和列:import numpy as npA= np.arange(16).reshape(4,4)print(A)print(A[1:3])

2020-10-17 00:20:40 170

原创 数据科学库(一)

文章目录numpy和pandas介绍numpy常用属性介绍定义numpy生成array的数据类型和表达形式zeros、ones、empty、arange、linspace方法numpy的基础运算基本数据运算判断矩阵中每个元素的大小矩阵乘法矩阵行或列求和矩阵索引及常用方法排序矩阵转置clip按行或列索引逐个索引array合并一维序列(向量)的转置(newaxis方法)array分割(split和vsplit、hsplit)等量分割(split和axis)等量分割(vsplit、hsplit)不等量分割nump

2020-10-13 22:10:48 291

原创 Linux_shell基础编程

文章目录shell基础编程shell介绍及基本案例shell程序变量命名变量类型变量赋值环境变量位置参量shell基础编程shell介绍及基本案例shell程序shell程序: 以文件形式存放批量的Linux命令集合,该文件能够被Shell解释执行,这种文件就是Shell脚本程序。通常由一段Linux命令、Shell命令、控制语句以及注释语句构成。Shell脚本的编写:1. Shell脚本是纯文本文件,可以使用任何文本编辑器编写2. Shell脚本通常是以.sh作为后缀名。shell脚

2020-10-13 13:42:19 119 1

原创 Linux系统管理

文章目录Linux系统管理第一部分系统信息系统日期和时间第二部分磁盘管理内存网络软件安装命令第一种方式:第二种方式:zip软件tar软件第三种方式:环境变量配置设置普通用户的sudo权限防火墙设置SELINUX禁用第三部分自带调度功能crontab(针对用户)crontab基本定义Linux系统管理第一部分系统信息常用命令:uname -r 显示当前系统内核版本cat /proc/cpuinfo 查看cpu信息cat /proc/meminfo 查看内存信息系统日期和时间常用命令:

2020-10-11 14:04:54 180 1

原创 python基础知识(一)

文章目录python程序的构成代码组织和缩进注释行连接符\对象引用标识符变量声明和赋值删除变量和垃圾回收机制python程序的构成#mermaid-svg-y20eHStt1WOGTPFe .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-y20eHStt1WOGTPFe .label text{fill:#3

2020-10-11 00:03:36 148

原创 Linux基本命令

文章目录文件常用三种类型文件权限文件归属文件相关命令链接vi/vim命令文件常用三种类型文件 :-目录 :d链接 :l如:-rw-rw-r- -. 1 beifeng beifeng 4096 Sep 28 11:05 Downloads第一部分:- rw- rw- r- - (数字表示:664)-: 表示文件类型后面九个字符,分为三组,表示此文件针对不同用户的权限关系。第二部分:beifeng beifeng第一字符串表示的是文件的拥有者:beife

2020-10-10 12:55:47 182

原创 Linux基本环境

Linux基本环境虚拟机(VMware上的CentOS为例)网络配置(NAT模式、桥接模式)、主机名设置、/etc/hosts记住核心的一点,虚拟机上的系统可以连接网络(内网或者外网),有一个IP地址即可。创建用户、基本命令(ls、mkdir、more)在Linux上查看ip地址使用命令:ifconfig,类似于Windows中的ipconfig。自动获取IP地址——可以连接互联网自动获取ip地址有时候会变动,需要设置固定的ip地址——network connections,选择网卡——编辑—

2020-10-10 01:58:18 110

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除