自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

转载 安装VSCode并设置使用Anaconda的环境

安装VSCode并设置使用Anaconda的环境

2022-05-01 11:03:32 3804

原创 数据库的学习与进阶(一)

数据库的入门知识感谢阿里刘飞飞老师的公开课程,得以对数据库的发展有个总体认知,以下是对该课程的整理。课程内容比较多,而我属于入门菜鸟,就根据自己的学习进度,一点点更新吧。本次主要是对数据库的演进过程、数据库业务视角分类、数据库系统的核心模块的内容整理。1、数据库的演进流程、各阶段的代表数据库。(1)商业起步阶段,结构化的数据RDBMS以SQL+OLTP联机事务处理,代表数据库有Or...

2020-02-19 15:46:48 334

原创 商业分析报告编写

数据来源数据分析数据分析方法一、数据分析方法1.业务数据分析:SQL,EXCEL1.1描述性分析1.2数据透视1.3可视化图表2.数据挖掘分析:Python,SPSS,SAS,R2.1协同过滤2.2分类分析2.3关联分析2.4聚类分析等3.大数据分析:Hadoop,Spark3.1Hadoop大数据平台3.2数据整理3.3建模、分析与展示二、业务数据分析流程...

2019-09-18 09:02:48 11424

原创 电商数据分析(一)

学习资料1、零一--电商数据分析与实战数据与业务结合。应用在电商的数据分析既要懂得分析也要懂得业务,甚至还要懂得平台【思维】+【业务】+【工具】+【数据】1、行业分析看:阿里和淘宝的运营指数http://index.1688.com/ 阿里指数https://alizs.taobao.com/area/?spm=a2oaa.11242873.0.0.29f16a843P...

2019-09-04 11:48:15 4200 1

原创 数据分析--分类与回归模型(一)

一、分类回归方法主要的分类、回归算法,网上和书上的资料进行梳理整理。二、各类分类方法代码参照《人工智能:python实现》一书,对部分代码进行了修改。1、logistic 回归logistics回归模型步骤根据挖掘目的设置特征,并筛选特征x1,x2...xp,使用sklearn中的feature_selection库,F检验来给出特征的F值和P值,筛选出F大的,p小的值...

2019-08-25 17:56:30 8815 1

原创 pycharm环境设置(一)

工欲善其事,必先利其器。之前一直用sublime写码,便捷快速。sublime也可以查看函数的用法,直接用help()就可以查看。跟随大家的脚步,也用pycharm吧。记录下来,便于自己后面查看。1、pycharm的提示参数的使用参照别人的,结果忘记把网址记下来了。汗。。。第三步:鼠标放到函数名,按住ctrl即可查看2、解释器设置,pycharm继承pyth...

2019-08-25 11:36:13 415

原创 天池数据--幸福感数据分析(一)

一、题目解析训练集是幸福度的调查数据,涵盖调查人员各维度指标,调查结果幸福度分为5级。对测试集的样本进行幸福度分级预测。数据精度评估标准:二、数据分析处理1、数据导入#导入库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.utils import shu...

2019-08-22 23:11:09 6341 1

原创 天池数据--工业蒸汽量预测

背景分析赛题描述经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),根据锅炉的工况,预测产生的蒸汽量。数据说明数据分成训练数据(train.txt)和测试数据(test.txt),其中字段”V0”-“V37”,这38个字段是作为特征变量,”target”作为目标变量。选手利用训练数据训练出模型,预测测试数据的目标变量,排名结果依据预测结果的MSE(meansquareerro...

2019-08-22 10:01:32 3494 5

原创 tableau部分图表制作

tableau数据分析--各类仪表板1、学校教育水平评估。考试成绩采用突出显示表,并进行城市、学院等快速筛选。2、城市教育水平评估各维度比较--构建比较参数,构建“比较计算”字段,对表格显示数据进行控制。城市地图因地图服务原因,暂不能显示。3、网站页面访问情况分析构造页面选择参数,对页面进行选择构造页面向下选择计算字段,对页面选择进行计算IF [页面选择]...

2019-08-21 17:23:57 625 1

原创 python数据分析与挖掘实战学习笔记(四)--聚类算法

第五章 数据建模(一)聚类分析1、主要方法2、距离分析度量样本之间的相似性,采用距离算法:文档相似性度量3、K-means分类#-*- coding: utf-8 -*-# 使用K-Means算法聚类消费行为特征数据import pandas as pd# 参数初始化inputfile = '../data/consumption_d...

2019-08-21 14:47:03 8743

原创 python数据爬取案例--地产数据及交通数据

一、地产数据爬取原创代码,打个标签,便于自己以后整理。1、数据来源数据来源为浙报传媒地产研究院的网上数据,红色标注区段改写后,可用于提取不同地市、不同时段的房地产土地交易数据,用于深入分析。2、数据爬取采用requests进行数据爬取,需要注意对异常数据的处理。本代码中采用try进行流拍、中止交易处理。from bs4 import BeautifulSoupimp...

2019-08-21 14:38:47 3573 2

原创 sublime设置python2、python3的环境

1、Python2环境设置,python3环境类似打开Sublime Text 3,依次进入new build system菜单(如图~)新建文件,进行修改,修改内容如下:{"cmd": ["C:/Python27/ArcGIS10.2/python.exe","-u","$file"], 斜杠需修改"file_regex": "^[ ]*File \"(...*?)\", l...

2019-08-10 10:08:17 178

原创 python绘图 d3.js 和echarts、Graphviz绘图

一、 采用mpld3使用d3.js进行可视化安装pip install mpld3另外又安装Ipython(Ipython不需要)、ntlk(报错,需安装)1、点图案例(1)绘制点状图import matplotlib.pyplot as plt, mpld3plt.plot([3,1,4,1,5], 'ks-', mec='w', mew=5, ms=20)mpl...

2019-07-27 22:38:29 4586

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除