自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 详解pandas数据分析之groupby分组聚合(基于电商平台数据)

该篇文章基于电商的商品数据信息,详细介绍pandas数据分析之分组聚合的方法与技巧(保密起见,只展示部分数据)。分组聚合结果展示:文章目录:一、导入pandas包并读取数据集数据数据字段说明二、分组1、生成分组对象2、查看分组对象类型3、查看分组对象的方法(函数)4、查看分组数量5、查看各分组6、查看各分组索引7、查看各分组的唯一识别标签...

2018-12-18 22:29:02 1414 1

原创 NLTK文本预处理与文本分析

本文主要介绍Python中NLTK文本分析的内容,咱先来看看文本分析的整个流程:原始文本 - 分词 - 词性标注 - 词形归一化 - 去除停用词 - 去除特殊字符 - 单词大小写转换 - 文本分析一、分词使用DBSCAN聚类算法的英文介绍文本为例:from nltk import word_tokenizesentence = "DBSCAN - Density-Based Spat...

2019-03-22 19:44:47 1258

转载 词性标注的词性说明

1. CC Coordinating conjunction 连接词2. CD Cardinal number 基数词3. DT Determiner 限定词(如this,that,these,those,such,不定限定词:no,some,any,each,every,enough,either,neither,all,both,ha...

2019-03-21 22:28:58 757

原创 python连接mysql与sql server数据库及相应的模块封装

一、Python连接MySQL数据库及模块封装1、连接模块封装步骤:首先建立名为“db_sql” 的文件夹,在文件夹下再建立名为“db_mysql”的“.py"文件,在改文件下编辑如下代码”:import pymysqlimport pandas as pddef execute_sql(sql): localhost = "72.106.100.12" us...

2019-02-21 20:50:45 1669 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除