自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 资源 (1)
  • 收藏
  • 关注

原创 课程笔记--006(IO操作、模块) 20200320

IO编程及模块一、IO编程文件读写打开文件读文件写文件with 语句注:二、模块模块的分类系统模块(Python官方提供的、内置的模块)第三方模块自定义的模块模块的导入查看模块内置模块os模块sys模块time & datetime 模块random模块math模块模块的定义一、IO编程IO在计算机中指Input/Output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由C...

2020-04-20 18:12:16 341

原创 课程笔记--005(函数调用)

目录调用函数(结构化,参数化编程)内建 Built-in 函数调用函数(结构化,参数化编程)Python中,函数的应用非常广泛,前面章节中我们已经接触过多个函数,比如 input() 、print()、range()、len() 函数等等,这些都是 Python 的内置函数,可以直接使用。一个程序可以按不同的功能实现拆分成不同的模块,而函数就是能实现某一部分功能的代码块。函数分为自定义函数和...

2020-04-20 15:58:48 1011

原创 课程笔记--004(程序控制、分支结构、for in、循环嵌套)

目录一、程序控制分支结构条件判断单分支双分支多分支range() 函数for...in循环一、程序控制流程控制是指在程序运行时,对指令运行顺序的控制。通常,程序流程结构分为三种:顺序结构、分支结构和循环结构。顺序结构是程序中最常见的流程结构,按照程序中语句的先后顺序,自上而下依次执行,称为顺序结构;分支结构则根据if条件的真假(True或者False)来决定要执行的代码;循环结构则是重复执...

2020-04-20 10:14:36 1171

原创 课程笔记--003(列表、元组、字典、集合)

目录一、列表创建列表使用列表删除列表元素列表内置函数与其他方法序列的通用操作和函数列表的专用操作和函数二、元组创建元组使用元组删除元组元组的内置函数三、字典创建字典使用字典删除字典的内置函数和方法集合创建集合一、列表Python内置的一种数据类型是列表:list。列表(Lists)属于Python中的序列类型,它是任意对象的有序集合,通过“位置”或者“索引”访问其中的元素,它具有可变对象、...

2020-04-19 17:26:03 327

原创 课程笔记--002(数据类型、命名规则、运算、字符)

目录一、数据类型整数布尔值浮点数复数型(Complex)字符串空值二、数据类型的转换三、变量命名规则四、运算算术运算赋值运算逻辑运算成员运算身份运算Python运算符优先级五、字符字符串和编码字符串的长度字符串的连接字符串的包含判断格式化 (占位符/格式化输出)一、数据类型Python3 中有六个标准的数据类型:●Numbers(数字类型)●Strings(字符串类型)●Lists(列表...

2020-04-19 13:32:27 465

原创 课程笔记-001(代码规范、解释器、输出、输入)

目录Python 编码规范一、代码编排二、文档编排三、空格的使用四、注释Python简介Python解释器命令行交互模式文本编辑器输出输入Python 编码规范一、代码编排1 缩进。4个空格的缩进(编辑器都可以完成此功能),不要使用Tab,更不能混合使用Tab和空格。2 每行最大长度79,换行可以使用反斜杠,最好使用圆括号。换行点要在操作符的后边敲回车。3 类和top-level函数定义...

2020-04-19 09:38:22 247

原创 Python 文档汇总

networkx:https://networkx.github.io/documentation/networkx-1.9/index.htmlpandas:https://pandas.pydata.org/pandas-docs/stable/index.htmlpandas中文:https://www.pypandas.cn/numpy:https://www.sogou.c...

2020-03-16 22:01:40 117

原创 Python Network(三)案例(无向图,有向图,权重,点线分类与大小粗细)

有关Python Network前面已经写过两篇基础入门文章Python Network(一)Python Network(二)本文主要是代码实战的case,主要看一些小技巧的地方目录1. 无向图1.1 无向图-数据来源数组1.2 无向图-数据来源外部引入数据2. 有向图3. 带权重3.1 带权重无向图3.2 带权重无向图1. 无向图1.1 无向图-数据来源数组import netw...

2020-03-14 18:17:28 12998 2

原创 Python Network(二)绘图draw系列draw(),draw_networkx(),draw_networkx_nodes(),draw_networkx_edges()

Python Network(一)目录1. nx.draw()1.1 示例2. draw_networkx()2.1 示例2.2 补充:matplotlib颜色对照表3. draw_networkx_nodes()本文主要讲解network最后的绘图功能1. nx.draw()默认情况下,将图形绘制为没有节点标签或边缘标签且使用完整Matplotlib图形区域且无轴标签的简单表示形式。有关...

2020-03-14 11:14:59 25828 11

原创 Python操作-合集(持续更新)

jupyterNotbook运行1.读取csv文件,转化为dataframe2.获取字符串中特定的内容3.字符串(str)与列表(list)相互转化4.找到指定子字符串后面的数字1.读取csv文件,转化为dataframeimport pandas as pdcsv_file = "filename.csv"csv_data = pd.read_csv(csv_file, lo...

2020-03-13 13:13:55 583

原创 Python Network(一)基础入门(节点和边基本概念,网络统计量)

基础首先是包的导入import networkx as nx以下基本图形类型作为Python类提供:图形:此类实现无向图。它忽略两个节点之间的多个边。它确实允许节点与其自身之间的自环边缘。图:有向图,即有向边的图。有向图(图的子类)共有的操作。多图:灵活的图类,允许在成对的节点之间存在多个无向边。附加的灵活性会导致性能降低,尽管通常并不明显。多图:MultiGraph的有向版本。...

2020-03-13 10:43:22 16501 5

原创 Python的文献计量分析流程实现--含代码

代码在jupyterNotebook中运行成功,过程中需要的包,已经安装完毕,每一代码格代表一个单元的代码,如需Pycharm运行,适当修改代码# 导入数据import pandas as pdWXdata=pd.read_excel('C:\\Users\\qingfeng\\Desktop\\PyDm_data.xlsx',sheet_name='WXdata') # 读取PyDm_da...

2020-02-20 12:45:57 4767 3

原创 【已解】pkg_resources.DistributionNotFound: The 'pip==19.3.1' distribution was not found and is required

不知道动了哪里,pip安装包,装不上了,一直提醒这个

2020-02-18 18:38:05 5891 4

原创 Python爬取国家政务服务平台关键词搜索的文件并分类存到CSV中

# 成果爬取国家政务服务平台,关键词“突发事件”,获取连接列表# -*- encoding:utf-8 -*-import urllib.requestfrom bs4 import BeautifulSoup # 导入urllib库的request模块import lxml #文档解析器import os ...

2020-02-18 11:34:25 2168 1

原创 Python中pandas相关解析--含代码实战

该文章代码均在jupyter Notebook中运行,且已安装re包

2020-02-09 19:50:59 410 1

原创 Python批量读取公司年报并进行情感分析--代码实战

import jiebaimport osimport csv# 读取预定的情感词列表def read_dict(file): text = open(file,encoding='gbk').read() text = text.split('\n') words = [w for w in text if w] # 去除空的内容 return word...

2020-02-08 19:08:21 5005 4

原创 Python正则表达式--含代码实战

该文章代码均在jupyter Notebook中运行,且已安装re包使用正则表达式可以保留自己想要的内容,比如仅提取汉字,仅提取数字等,中文汉字的正则表达式 \u4e00-\u9fa5import re text='sdfgfvdscsx是的sd好're.findall(r'[\u4e00-\u9fa5]',text)上文中提取的内容不连续,且提取出的内容为列表形式,需要将其转化为...

2020-02-07 18:21:44 192 1

原创 python中结巴分词思路解析-含代码实战

本文代码均在jupyter Notebook上运行,已安装jieba包结巴常用的函数结巴常用函数作用jieba.lcut(text)对text文件内容进行分词,返回的是分词后的词语列表jieba.load_userdic(txt_file)为防止某些目标词汇分割,需要载入紫东义词典,告诉程序说,这几个字是一个词语,不要分割jieba.lcut(text)代...

2020-02-07 14:37:57 1307

原创 python之数据可视化matplotlib 完善统计图形

1 图例完善基础版:import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as npmpl.rcParams["font.sans-serif"]=["SimHei"]mpl.rcParams["axes.unicode_minus"]=Falsex=np.linspace(-2*np.pi,2*n...

2020-01-19 19:46:22 418

原创 python之matplotlib使用统计函数绘制简单图形

1 函数bar()–用于绘制柱状图import matplotlib as mplimport matplotlib.pyplot as plt# 解决中文显示问题mpl.rcParams["font.sans-serif"]=["SimHei"]mpl.rcParams["axes.unicode_minus"]=False# 引入数据x=[1,2,3,4,5]y=[6,10...

2020-01-09 17:50:40 1116

原创 python matplotlib数据可视化(六)(折线绘圆,椭圆绘圆,楔形绘饼图,楔形绘圆环饼图)

用折线图绘制圆# 导入包import matplotlib.pyplot as pltfrom matplotlib.patches import Circleimport numpy as np# 绘图fig,ax = plt.subplots(2,2)x=np.linspace(0,2*np.pi,500)y1=2*np.cos(x)y2=2*np.sin(x)# su...

2020-01-05 20:39:14 923

转载 使用pip命令出现TypeError: 'module' object is not callable

已经实践操作,效果良好

2019-12-29 16:40:37 521

原创 python中使用函数matplotlib的图表组成元素代码实战及详细讲解

import matplotlib.pyplot as pltimport numpy as npfrom matplotlib import cm as cm# define data 数据设置x = np.linspace(0.5,3.5,100)y = np.sin(x)y1 = np.random.randn(100)# scatter figure 散点图绘制plt....

2019-12-29 16:38:54 302

原创 python matplotlib数据可视化(五)(patches绘制几何图形,圆,矩形,圆弧,楔形)

使用模块化patches绘制几何图形

2019-12-20 21:58:09 6317 1

原创 python中使用xlabel()设置标签文本,并解决中文显示问题

import matplotlib.pyplot as pltimport numpy as npx = np.linspace(0.05,10,1000)y = np.sin(x)plt.plot(x,y,ls='-.',lw=2,c='c',label='plot figure')plt.legend()plt.xlabel('x-axis')plt.ylabel('y-axis...

2019-12-20 21:56:41 19514 4

原创 python matplotlib数据可视化(四)(交叉间断型曲线颜色填充)

交叉间断型曲线的颜色填充# 导入包import matplotlib.pyplot as pltimport numpy as np# 绘图fig,ax = plt.subplots(1,2)# 子图(121)数据x=np.linspace(0,2,500)y1=np.sin(2*np.pi*x)y2=1.2*np.sin(3*np.pi*x)y2=np.ma.masked...

2019-12-14 10:00:32 738

原创 python matplotlib数据可视化(三)(水平/垂直交叉曲线的颜色填充)

水平方向的交叉曲线的颜色填充方法主要通过fill_between()来实现水平方向的交叉曲线的颜色填充目标。# 导入包import matplotlib.pyplot as pltimport numpy as np# x与y数据x=np.linspace(0,2,500)y1=np.sin(2*np.pi*x)y2=1.1*np.sin(3*np.pi*x)# 绘图,见注解1...

2019-12-12 13:21:02 789

原创 python matplotlib 数据可视化(二)(交叉曲线颜色填充,x轴引入数据解析)

上次内容中写道如何为封闭区域填充颜色,用到了fill(),详情见链接https://blog.csdn.net/weixin_44301621/article/details/103408786这次会讲一下,散点图相关内容import matplotlib.pyplot as pltimport pandas as pdimport numpy as npbeer = pd.read_...

2019-12-08 17:13:33 769

原创 python matplotlib 数据可视化(一)(向几何图形填充颜色)

向几何图形中填充颜色一、规则多边形颜色填充代码如下:import matplotlib.pyplot as pltimport numpy as npx = [0, 0, 5, 10, 15, 15, 10, 5]y = [5, 10, 15, 15, 10, 5, 0, 0]plt.fill(x, y, color = "cornflowerblue")plt.xlim(-8, ...

2019-12-05 18:25:39 2727

原创 python中的库分类

python中,库或者模块是指一个包含若干函数定义、类定义或者常量的python源程序文件。python中有大量的内置模块和标准库,比如:math(数学模块)、random(与随机数以及随机化有关的模块)、datetime(日期时间模块)、collections(包含更多扩展版本序列的模块)、functools(与函数以及函数式编程有关的模块)、urllib(与网页内容读取以及网页地址解析有关的...

2019-12-05 17:06:39 1920

原创 python中标准库与扩展库对象的导入与使用

import 模块名[as 别名]使用这种方式将模块导入以后,使用时需要在对象面前加上模块名作为前缀,必须以“模块名.对象名”的形式进行访问,如果导入的模块名字很长,可以为导入的模块设置一个别名,然后使用“别名.对象名”的方式来使用其中的对象上图是在导入math标准库,然后计算6的阶乘上图是导入扩展库numpy,设置别名为np,并计算多个角度的正弦值上图为导入标准库os.path,设...

2019-12-01 17:45:51 4647

原创 聚类算法介绍实现(一)

最近跟着师兄在做一些课题,有些内容师兄其实已经基本实现了,但是我不太会,所以就把师兄实现思路借鉴过来学习一下相关的内容。大的目标是用python实现密度聚类,因为坐标都是在地图上的,所以最开始学习忽略了经纬度转换问题,从最基础的开始。聚类的类型大多数的参考书上把聚类算法划分为了两大类:K-means与DBSCAN(Density-Based Spatial Clusting of Applic...

2019-11-20 13:48:42 643

原创 You are using pip version 19.0.3, however version 19.3.1 is available. You should consider upgrading

You are using pip version 19.0.3, however version 19.3.1 is available.You should consider upgrading via the ‘python -m pip install --upgrade pip’ command.的解决我要pip安装新的包,总是提示上述错误然后就按照提示更新但是依然报错,于是我...

2019-11-16 15:14:00 1026 3

原创 LDA主题模型从分词到词云再到模型

这是我在做本科内容时,从python小白,一直到能够做出计算结果有关代码的记录,代码均能跑起来,有些内容可以看我前面文章,这个章节主要是我的一些代码记录。结巴分词# -*- coding: utf-8 -*-import jiebaimport jieba.analyseimport jieba.posseg as psegimport re# 加载词典jieba.load_us...

2019-11-16 12:59:25 2823

翻译 TF-IDF是什么学习笔记(基础版)

TF—IDF是什么TF-IDF的算法,目的是计算词的权重,由两部分组成,一部分是TF(词项频率),另一部分是IDF(逆向文档频率)。通俗的讲,就是,TF-IDF = TF * IDF。也就是说,我们在考虑词的权重的时候,不再只考虑这个词在文档中出现多少次。TFTF考虑了词项的类内代表性,其实,我也不懂什么叫类内代表性,总之,它就是像数数一样,看一个词在一个句子中出现多少次,然后计算频率。但是...

2019-05-08 16:08:52 590

转载 UnicodeDecodeError: 'gbk' codec can't decode byte 0xa0 in position 8: illegal multibyte sequence

参考链接https://www.cnblogs.com/lizhe-Ning/p/9886310.html

2019-04-27 11:09:56 3807 2

原创 python读取文件,jieba分词,posseg标注词性,并写入文件,代码实战

先列出代码如下# -*- encoding=utf-8 -*- # 定义编码格式import jieba.analyseimport jieba.possegimport jiebaimport pandas as pd# 载入自定义词典jieba.load_userdict('dict.txt')# 载入自定义停止词jieba.analyse.set_stop_words(...

2019-04-26 22:44:18 11590 2

原创 python中读入文件jieba分词,使用字典和停用词,再将结果写入文件

具体代码如下# -*- encoding=utf-8 -*-import jieba.analyseimport jiebaimport pandas as pd# 载入自定义词典jieba.load_userdict('dict.txt')# 载入自定义停止词jieba.analyse.set_stop_words('stop_words.txt')# 去掉中英文状态下的逗号...

2019-04-26 12:10:59 3365 6

转载 Python pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 121, saw

参考链接:https://www.jianshu.com/p/be233bdb4dbf

2019-04-26 11:19:30 4083

转载 wordcloud 词云 关键字重复多次

参考链接:https://segmentfault.com/q/1010000014224890

2019-04-26 11:18:48 8210

titanic(泰坦尼克).zip

“Python pandas 泰坦尼克号数据分析”一文所用到的数据,数据为压缩包形式,请下载后解压再使用

2020-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除