- 博客(13)
- 收藏
- 关注
原创 数据库的学习与进阶(一)
数据库的入门知识感谢阿里刘飞飞老师的公开课程,得以对数据库的发展有个总体认知,以下是对该课程的整理。课程内容比较多,而我属于入门菜鸟,就根据自己的学习进度,一点点更新吧。本次主要是对数据库的演进过程、数据库业务视角分类、数据库系统的核心模块的内容整理。1、数据库的演进流程、各阶段的代表数据库。(1)商业起步阶段,结构化的数据RDBMS以SQL+OLTP联机事务处理,代表数据库有Or...
2020-02-19 15:46:48 334
原创 商业分析报告编写
数据来源数据分析数据分析方法一、数据分析方法1.业务数据分析:SQL,EXCEL1.1描述性分析1.2数据透视1.3可视化图表2.数据挖掘分析:Python,SPSS,SAS,R2.1协同过滤2.2分类分析2.3关联分析2.4聚类分析等3.大数据分析:Hadoop,Spark3.1Hadoop大数据平台3.2数据整理3.3建模、分析与展示二、业务数据分析流程...
2019-09-18 09:02:48 11424
原创 电商数据分析(一)
学习资料1、零一--电商数据分析与实战数据与业务结合。应用在电商的数据分析既要懂得分析也要懂得业务,甚至还要懂得平台【思维】+【业务】+【工具】+【数据】1、行业分析看:阿里和淘宝的运营指数http://index.1688.com/ 阿里指数https://alizs.taobao.com/area/?spm=a2oaa.11242873.0.0.29f16a843P...
2019-09-04 11:48:15 4200 1
原创 数据分析--分类与回归模型(一)
一、分类回归方法主要的分类、回归算法,网上和书上的资料进行梳理整理。二、各类分类方法代码参照《人工智能:python实现》一书,对部分代码进行了修改。1、logistic 回归logistics回归模型步骤根据挖掘目的设置特征,并筛选特征x1,x2...xp,使用sklearn中的feature_selection库,F检验来给出特征的F值和P值,筛选出F大的,p小的值...
2019-08-25 17:56:30 8815 1
原创 pycharm环境设置(一)
工欲善其事,必先利其器。之前一直用sublime写码,便捷快速。sublime也可以查看函数的用法,直接用help()就可以查看。跟随大家的脚步,也用pycharm吧。记录下来,便于自己后面查看。1、pycharm的提示参数的使用参照别人的,结果忘记把网址记下来了。汗。。。第三步:鼠标放到函数名,按住ctrl即可查看2、解释器设置,pycharm继承pyth...
2019-08-25 11:36:13 415
原创 天池数据--幸福感数据分析(一)
一、题目解析训练集是幸福度的调查数据,涵盖调查人员各维度指标,调查结果幸福度分为5级。对测试集的样本进行幸福度分级预测。数据精度评估标准:二、数据分析处理1、数据导入#导入库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.utils import shu...
2019-08-22 23:11:09 6341 1
原创 天池数据--工业蒸汽量预测
背景分析赛题描述经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),根据锅炉的工况,预测产生的蒸汽量。数据说明数据分成训练数据(train.txt)和测试数据(test.txt),其中字段”V0”-“V37”,这38个字段是作为特征变量,”target”作为目标变量。选手利用训练数据训练出模型,预测测试数据的目标变量,排名结果依据预测结果的MSE(meansquareerro...
2019-08-22 10:01:32 3494 5
原创 tableau部分图表制作
tableau数据分析--各类仪表板1、学校教育水平评估。考试成绩采用突出显示表,并进行城市、学院等快速筛选。2、城市教育水平评估各维度比较--构建比较参数,构建“比较计算”字段,对表格显示数据进行控制。城市地图因地图服务原因,暂不能显示。3、网站页面访问情况分析构造页面选择参数,对页面进行选择构造页面向下选择计算字段,对页面选择进行计算IF [页面选择]...
2019-08-21 17:23:57 625 1
原创 python数据分析与挖掘实战学习笔记(四)--聚类算法
第五章 数据建模(一)聚类分析1、主要方法2、距离分析度量样本之间的相似性,采用距离算法:文档相似性度量3、K-means分类#-*- coding: utf-8 -*-# 使用K-Means算法聚类消费行为特征数据import pandas as pd# 参数初始化inputfile = '../data/consumption_d...
2019-08-21 14:47:03 8743
原创 python数据爬取案例--地产数据及交通数据
一、地产数据爬取原创代码,打个标签,便于自己以后整理。1、数据来源数据来源为浙报传媒地产研究院的网上数据,红色标注区段改写后,可用于提取不同地市、不同时段的房地产土地交易数据,用于深入分析。2、数据爬取采用requests进行数据爬取,需要注意对异常数据的处理。本代码中采用try进行流拍、中止交易处理。from bs4 import BeautifulSoupimp...
2019-08-21 14:38:47 3573 2
原创 sublime设置python2、python3的环境
1、Python2环境设置,python3环境类似打开Sublime Text 3,依次进入new build system菜单(如图~)新建文件,进行修改,修改内容如下:{"cmd": ["C:/Python27/ArcGIS10.2/python.exe","-u","$file"], 斜杠需修改"file_regex": "^[ ]*File \"(...*?)\", l...
2019-08-10 10:08:17 178
原创 python绘图 d3.js 和echarts、Graphviz绘图
一、 采用mpld3使用d3.js进行可视化安装pip install mpld3另外又安装Ipython(Ipython不需要)、ntlk(报错,需安装)1、点图案例(1)绘制点状图import matplotlib.pyplot as plt, mpld3plt.plot([3,1,4,1,5], 'ks-', mec='w', mew=5, ms=20)mpl...
2019-07-27 22:38:29 4586
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人