自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

飞羽的博客

Top-Down

  • 博客(53)
  • 资源 (17)
  • 问答 (1)
  • 收藏
  • 关注

原创 pandas.read_csv() 报错 OSError: Initializing from file failed,报错原因分析和解决方法

pandas.read_csv() 报错 OSError: Initializing from file failed,一般由两种情况引起:一种是函数参数为路径而非文件名称,另一种是函数参数带有中文。

2018-06-04 11:22:55 77226 37

原创 Gephi 入门使用

第一部分: Gephi 的安装与基本使用1.安装 Gephi下载地址: https://gephi.github.io/users/download/,下载后安装即可,如果能够正常打开 Gephi,跳过下面提示。 提示:如果安装完后出现“cannot find java 1.6 or higer”,解决方法如下,点击链接 http://www.itmop.com/soft/downi...

2018-04-08 18:13:28 119016 48

原创 树莓派 安装 ubuntu 笔记

对于有过折腾电脑经验的人来说,下载、烧录都不是问题,最终这个无线连接的问题特别是在没有屏幕连接的情况下还是很烦人的,第一次连接最困难。

2023-07-20 23:00:00 335

原创 使用 Docker 安装 Centos6.5 环境和python3.6

安装Docker由于我的是win10企业版,不能直接安装Dokker(错误:Docker Desktop requires Windows 10 Pro or Enterprise version 15063 to run),所以通过docker toolbox安装docker:Windows10 使用docker toolbox安装docker出现windows 正在查找bash.exe解决点击Docker出现windows 正在查找bash.exe。如果想亲自查找文件,请点击“浏览”的问题安装c

2021-02-05 17:13:00 585 3

原创 email 安装报错 No module named 'cStringIO'

python 自动发送邮件需要用到 email,但是python3 在安装email包的时候出现了难以解决的问题。

2020-04-17 15:50:12 4738 8

原创 python 梳理:安装并开始使用

Anaconda 是python的一个发行版,内置了很多其他工具,也免去了这些工具单独安装和配置的麻烦。

2020-04-10 19:28:25 726

转载 Python中的魔术方法详解

在Python中,所有以“__”双下划线包起来的方法,都统称为“Magic Method”,中文称『魔术方法』,例如类的初始化方法 __init__ ,Python中所有的魔术方法均在官方文档中有相应描述,但是对于官方的描述比较混乱而且组织比较松散。很难找到有一个例子。

2020-04-01 12:07:33 830 2

原创 Python 模拟黑客帝国中的“代码雨”

黑客帝国中的“代码雨”让人感觉仿佛身处电脑的虚拟世界中一样,然后就有大神利用代码实现了“代码雨”,让我有了神的力量。

2020-03-24 10:04:53 1924

原创 python 函数 默认值更改使用的三种方法

在固定长度参数中需要设置关键字参数的默认值, ```d=1, e=2```就是设置的默认值,不传入关键字参数的时候就是使用该默认值,也可以根据需要更改默认值。

2020-03-17 18:43:09 6134

原创 pandas 读取excel、一次性写入多个sheet、原有文件追加sheet

pandas 的DataFrame 数据结构与excel中的数据形式极为相似,因此对于excel数据的读取和输出使用pandas再适合不过了,因此就涉及到了pandas对于excel文件的读取、写入一个sheet、写入多个sheet、追加sheet等操作。

2020-03-06 12:39:42 43395 9

原创 pyecharts 十种图形演示

Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。

2020-03-06 11:21:58 3338

原创 在 Windows 上部署 Gitblit 解决不能 Failed creating java 问题

在 Windows 上部署 Gitblit 教程:在windows部署gitblit在部署的最后一步的时候无法实现注册服务并启动,解决方案如下:原因:JVM是x86的1.sc delete gitblit 删除服务2.修改installService.cmd,ARCH=x863.再运行 installService.cmd 即可,启动服务里的gitblit成功...

2020-01-09 11:24:49 1741

转载 window10 利用msysgit和copssh搭建git本地服务器

msysgit就不做过多的解释了,是git安装包,copssh是用来提供ssh服务的,git提供四种不同的协议用来传输数据:本地协议、ssh协议、git协议和http协议。

2019-12-12 19:22:49 158

原创 Power Designer 的安装和使用

Power Designer

2019-11-12 18:19:50 744

转载 如何深入浅出的理解数据仓库建模?

如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作电脑文件和文件夹,我们希望按照自己的习惯有很好的文件夹组织方式,而不是糟糕混乱的桌面,经常为找一个文件而不知所措。

2019-11-08 11:19:20 488

原创 第二部分 实体、属性和关系

对于数据建模最重要的三项技能 1.了解业务知识的能力; 2.语言沟通能力; 3.数据库的规范化知识。 这一系列涉及到的只有语言沟通能力和数据库的规范化知识,但是能被呈现在博客里的只有数据库的相关规范知识。

2019-11-04 20:22:43 18476

原创 DataFrame 新增列的五种方法

本文总结了平时对 pandas.DataFrame 进行新增列操作的五种方法:insert、reindex、loc、obj['col']、concat,并用代码演示出来。

2019-10-24 12:06:23 250376 8

原创 第1部分 基本流程

数据建模的基本流程以及如何建立高效的数据模型。

2019-10-21 16:38:29 258

翻译 Python 的 TOP50 数据可视化 图形(包含代码)

使用python中最有用的50个数据可视化图形,并且用代码清晰的演示了使用matplotlib和seaborn库的过程并且展示了最终的结果。

2019-10-16 20:34:01 9971 1

原创 pandas Multiindex 对层次化索引进行切片或索引

选取 DataFrame 使用正常的 loc 或 iloc 索引数据,但是对于 Multiindex 层次化索引该怎么索引数据呢?

2019-10-09 21:18:05 8244 1

原创 Flask 结合 pandas.DataFrame 输出文件(excel/csv)

Flask 是使用 Python 编写的一个轻量级web框架,使用 Flask 可以快速的搭建起一个网站,轻量级体现在框架提供了基础的应用框架(定义app、templates、Field等),其余目的的可以使用外部包达成。pandas是基于 Numpy 的一种工具,该工具是为了解决数据分析而创建的,在 Numpy 的快速计算基础上增加了行和列名,可以读取文件、数据库数据并进行交互,**pandas.DataFrame** 是 pandas 中的一种表型数据结构。

2019-09-25 12:48:39 8690 7

原创 pandas.read_sql 使用参数进行数据查询

pandas.read_sql 可以在数据库中执行指定的SQL语句查询或对指定的整张表进行查询,以DataFrame 的类型返回查询结果,这是在跟数据库进行交互操作时很重要的一步——既读取数据,还返回DataFrame方便处理。

2019-09-20 12:43:00 18719 2

原创 自学的学习方式探索

自上而下的教学风格侧重于为学生提供一个主题的大视图,让他们沉浸在大图中,而无需解释构成主题的组件。与自上而下的教学方法不同,自上而下的教学方法首先采用主题的宏观视图,自下而上的教学方法从主题的组成部分开始,逐渐建立到整体。

2019-08-23 17:53:25 1162

原创 Tableau 跟着固定成员移动的参考线

这里不仅展示了如何创建一条跟着固定成员移动的参考线还会详细介绍整个操作流程。操作目的:创建一个参考线,在选择了维度、指标、筛选器之后,参考线的值是维度下某固定成员的指标值,不是最大值、最小值、平均值、固定值等这些tableau上可见的值,而是随着筛选器的变化,参考线也会变成筛选器选定值下某固定成员的值。

2019-08-08 11:54:33 2393 1

原创 PyQt5 创建数据处理小工具(pycharm+pyqt5+pyinstaller)

使用 pyqt+pyinstall 建立数据处理小工具,让非数据分析人员可以一键获取想要的数据,不再麻烦我们数据分析师。

2019-07-23 20:35:17 1469

原创 python 3 类的普通方法、实例方法、静态方法、类方法的区别

一、类和实例的调用情况1.新建一个类,包含普通方法、实例方法、静态方法、类方法class TestMethod: def fun(): print('fun') def funSelf(self): self.name = 123 print(self.name) @staticmethod...

2019-05-09 19:22:08 1167

转载 如何才能拥有自己的数据技术工匠?

在杭州,只要你是做数据的,阿里等互联网公司绝对是绕不过去的,现在到处都可以看到它们的身影,大家都说杭州互联网氛围很好,人才好找,但实际竞争激烈,各种猎头,各种社招,各种关系,无孔不入。从事大数据工作以来,团队成员的社会化流动逐渐成了常态化的事情,今天就来谈一谈最近的几点思考。如果你的数据团队没有被外部威胁到过,要么是你的业务偏居一隅,要么就是数据技术的落后,大多数时候,我们企业内部的数据人才...

2019-04-18 12:09:59 276

转载 AFTN和SITA报文简介

飞行动态固定格式电报分为:AFTN和SITA两种格式的电报。AFTN格式电报:供空中交通管制部门使用SITA格式电报:供航空公司航务部门使用,两种格式不能混合使用1.AFTN报文AFTN全称为民用航空飞行动态固定电报格式,具体格式如下:(1)第一行:电报种类(2)第二行:使用时间(UTC时间)(3)第三行:电报级别下面分别对以上格式内容做说明:电报种类说明:用三个字母表示电...

2019-04-01 15:53:34 26432

转载 navicat 导入xlsx格式 报错 “**无法打开文件错误**”

多次丛navicat 导入excel数据,主要是xlsx的格式多(因为这个数据量的范围很广),但是经常报“无法打开文件错误”的问题,之前的解决方法是保存为csv或xls格式,但是最近发现了问题并有了解决方法:原因:缺少驱动,需要去微软官网下载AccessDatebaseEngine,位数最好和navicat,office一致。这个是传送门:https://www.microsoft.com/z...

2019-03-06 15:27:58 2548

原创 Anacond+pycharm+PyQt5 安装及使用测试

整个安装的过程参考:python3.6,Anaconda3下pyqt5开发环境搭建但是在最后把ui转化成py文件后,不是在文件中添加代码,而是新建一段代码import sysimport untitledfrom PyQt5.QtWidgets import QApplication, QMainWindowif __name__ == '__main__': app = QA...

2018-12-05 09:49:55 700

转载 公司的数据分析支撑工作,到底外包好还是自主好?

在这个大数据时代,无论是企业还是个人,必须找到那些你自己做,比市场更高效的事情,建筑你的核心竞争力,而把那些你做的其实一般的事情,尽快扔回给市场,要有所为而有所不为。

2018-06-25 10:19:39 7581

原创 pandas loc、iloc、ix区别对比以及他们切片的区别

一开始自学Python的numpy、pandas时候,索引和切片把我都给弄晕了,特别是numpy的切片索引、布尔索引和花式索引,简直就是大乱斗。但是最近由于版本的问题,从之前的Python2.7改用Python3.6 了,在3.6中提供了loc和iloc两种索引方法,把ix这个方法给划分开来了,所以很有必要做个总结和对比。

2018-05-10 18:31:42 25211 4

原创 matlibplot.pyplot 画图 axes.bar() x轴默认排序解决方法

问题描述使用matlibplot.pyplot中的axes.bar()作图后x轴是默认排序的,这其实打乱了我一开始数据中的排序,是我不想要的,我想要的是x轴按照我数据中的原始顺序排序。import matplotlib.pyplot as pltIn [1]:df2_bOut[1]: 项目建设周期<0天 100天 66571个月 1893...

2018-05-04 17:36:27 17577

原创 30分钟迅速上手python

我从两年前接触python,到现在python已经陪伴我渡过了我的大半个职业生涯,用过Django开发个人博客,用过pandas、numpy做过数据分析,还用过scikit-learn的数据挖掘算法,还使用过spider写爬虫,但是种种过往在脑中好似一场云烟,经历过却什么都没留下,所以从头开始梳理,将Python的相关知识点一一记录下来。 我一直使用的是经典2.7,官方称2020后将停...

2018-04-02 14:41:34 1611

原创 python-django 阿里云ECS服务器部署uwsgi+nginx过程解说

需求:在本地已经完成了一个博客系统/数据可视化系统的开发,需要部署到系统上,展示个人主页/个人作品编程语言:Python 系统框架:Django 数据库:MySQL服务架构:uwsgi+nginx IDE:pycharm 代码管理:Git我的系统目录: 1、购买服务器首先购买云服务器,这里选择的阿里云ECS,使用的u...

2018-03-12 19:32:45 4924 2

转载 MATLAB 封装发布exe

从2016a开始到现在的2017,从MATLAB中创建出一个独立的应用程序有多种方法,可以用MATLAB提供的现有函数或者现有App。 本文介绍的是利用MATLAB的Application Compiler工具创建一个独立的应用程序,以下这个例子显示了如何从MATLAB中生成独立的应用程序。

2017-12-18 17:59:20 1883

原创 MATLAB 显示输出数据的三种方式

MATLAB显示输出数据主要有三种方式,一种是直接在命令行输入数据项并且不加“;”符号,另外两种是利用disp函数和fprintf函数实现

2017-12-12 11:31:56 446993 6

转载 pandas多级分组如何排序

pandas有groupby分组函数和sort_values排序函数,但是如何对dataframe分组之后排序呢?

2017-08-10 14:56:29 14851 3

转载 pip --upgrade批量更新过期的python库

在stackoverflow上有人提供了批量更新的办法,一个循环就搞定

2017-07-28 17:02:43 5277 2

转载 网络原理,以及对VMware Workstation虚拟网络VMnet0、VMnet1、VMnet8的图解

网络原理,以及对VMware Workstation虚拟网络VMnet0、VMnet1、VMnet8的图解借鉴了:http://hi.baidu.com/whitelocus/blog/item/d091ded88ac669e038012f5a.html1. 文中符号的说明:        : 可以理解成A,也可以理解成B。2. 术语        调制解调器(Mo

2017-06-22 14:24:16 1414

tableau desktop 2019.4.3 版本 安装包

1.内容:tableau desktop 2019.4.3 版本 安装包,这个版本包含了jdbc的连接,可以连接clickhouse数据库。 2.脚本内容:安装脚本里包含了网盘资源的连接和密码,安装包大小426M。 3.提示:如有问题私信我。

2022-06-21

安装并开始使用.ipynb

anaconda 的安装与jupyter notebook使用简介,博文地址:https://blog.csdn.net/qq_35318838/article/details/105440110

2020-04-10

Top 50 Matplotlib图.ipynb

使用python中最有用的50个数据可视化图形,并且用代码清晰的演示了使用matplotlib和seaborn库的过程并且展示了最终的结果。 文章地址:https://blog.csdn.net/qq_35318838/article/details/102590566

2019-10-16

flask 演示.zip

Flask 结合 pandas.DataFrame 输出文件(excel/csv),可以实现文件的下载和输出。

2019-09-25

Pyqt5 演示.zip

使用 pyqt+pyinstall 建立数据处理小工具,让非数据分析人员可以一键获取想要的数据,不再麻烦我们数据分析师。

2019-07-23

数据资产管理实践白皮书4.0.pdf

最新发布的数据资产管理实践白皮书4.0,并且有个人整理并加上了白皮书的目录,方便阅读和查找资料。

2019-06-15

Python数据分析与挖掘实战.pdf

Python数据分析与挖掘实战.pdf 实例讲解python的数据挖掘案例

2018-03-22

NLP—数学之美.pdf

NLP—数学之美.pdf 简单的理解NLP过程,发现蕴含其中的数学美丽。

2018-03-22

深入浅出统计学.pdf

深入浅出统计学(中文版).pdf 有目录 很简单的理解统计学

2018-03-22

MATLAB初学者教程.pdf

数学专业软件,机器学习必会软件 包含MATLAB的常用知识和基础教学

2018-03-22

统计学习方法.pdf

统计学习方法,李航著作的pdf文件,含有目录。 主要内容是数据挖掘算法及流程。

2018-03-22

谷歌收藏夹备份

个人备份

2017-03-03

kettle资源

kettle实例

2017-03-03

决策树联系数据源

为决策树的代码实现提供数据

2017-02-24

k-means算法实现数据

用于k-means训练数据

2017-02-08

机器学习——iris数据

Python——sklearn模块iris数据,可使用与机器学习、数据挖掘算法练习

2017-01-25

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除