brave_jcc-CSDN博客

原创从node.js、npm、react到electron 环境搭建的那些事

#vscode使用技巧查看npm下载的包的存放路径npm config get prefix修改全局安装路径npm config set prefix “D:/WebCode/npm”npm config set cache “D:/WebCode/npm/”切换成淘宝的镜像npm config set registry https://registry.npm.taobao.org查看是否切换成功npm config get registry查看cnpm是否安装成功cnpm -vn

2021-01-15 11:26:03 112

翻译数据分析知识（一）用户行为分析+不同产品周期产品经理要做的事

最近迷上了用思维导图梳理知识点哈哈哈，凑活看~~用户行为分析产品经理在不同产品生命周期该做的事

2018-09-04 11:36:03 360

原创 mysql 【变量+leetcode常见题】

一、mysql变量声明与定义1. 使用set2. 使用select二、实现成绩排名1. 排名并列2.排名不并列一、mysql变量声明与定义有两种使用方式：1. 使用setset @varname=999 或者 set @varname:=9992. 使用select由于select语句中，’=’表示比较，不是赋值的意思，故此种变量赋值只...

2018-07-25 17:11:06 421

原创数据分析实战——统计、绘图分析数据

根据获取的数据，进行描述统计分析，并绘制直方图获取数据及其描述统计分析#获取数据get_housing_data()housing_data=load_housing_data(housing_path)# 查看数据类型，后面主要使用的是pandas包print(type(housing_data))# 查看前五条数据print(housing_data.head...

2018-07-09 16:11:28 1983

原创 python可视化之matplotlib

利用matplotlib绘图基本流程：导入相关包 import matplotlib.pyplot as plt import numpy as np from numpy.random import randn 创建图表 fig=plt.figure(…) axe1=fig.add_subplot(行，列，位置) axe2=fig.a...

2018-07-04 11:01:31 245

原创 pip安装第三方库pyecahrts报错

通过pip安装个第三方可视化工具，pyecahrts，但是出错了！！！解决方法设置超时时间，输入如下内容：pip –default-timeout=100 install -U pyecharts 搞定...

2018-07-03 11:20:56 237

原创机器学习（一）——k-近邻、kd树及其python实现

1.k近邻的基本原理1.1基本流程1.2k-近邻的三个基本要素1.3k近邻的python实现2.kd树2.1构造平衡kd树2.2 搜索kd树2.3搜索kd树分析2.4kd树的python实现1.k近邻的基本原理1.1基本流程 k-近邻通过测量不同特征属性之间的距离来分类一般流程：（1）计算当前点与已知类别（训练集）中的各个点之间的距...

2018-05-17 10:08:19 1176

原创《谁说菜鸟不会数据分析（入门篇）》总结

一、数据分析方法论营销方面：4P、用户使用行为、STP理论、SWOT管理方面的理论模型：PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等PEST（宏观环境分析）P(political)政治环境（社会性质、执政党性质、方针、政策、法令）政治经济体制、财政税收政策、产业政策等E(economic)经济环境宏观GDP及其增长率、进出口总额、利率、税率、通货膨胀率、微观消费价格指数...

2018-04-08 09:12:06 4069

原创【数据库】数据库知识点梳理

目录一、数据库基础知识二、操作语句创建模式创建表修改表删除约束索引查询查询条件 Order by聚集函数Group by 连接查询嵌套查询一、数据库基础知识二、操作语句创建模式create schema test0402; use test0402; 创建表createtable ...

2018-04-02 22:22:01 779

原创 python文件写入excel

需求描述：将爬取的新闻数据按照、url地址、url Id、新闻标题、新闻内容字段写入excel表1.安装并导入xlwt模块2.主要函数介绍enumerate 函数用于遍历序列中的元素以及它们的下标w=xlwt.workbook()创建工作簿，可以指定编码格式shet=w.add_sheet(name)创建Excel的sheet页，并指定页名shet.write(row,col,value，styl...

2018-03-28 11:57:49 1308

原创使用matplotlib中的scatter绘图函数分析iris数据集中的特征属性

iris数据集导入有好几种方式，本文采用的是从sklearn包中直接导入使用，并选取期中两列的属性，用散点图分析，代码参考了《机器学习实战》# import numpy as np# from numpy import *# import operatorfrom sklearn.datasets import load_iris# import matplotlibimport ma...

2018-03-26 15:28:25 1129

原创 python文件读取

一、使用内置文件读取函数1.open(file,r(rb、w、wb))——相关参数 File指文件名，r指读，rb指以二进制形式读取，w指写（直接覆盖原有内容），wb以二进制形式写入2.read()一次读取全部内容——使用with语句：不需要显示关闭，自动调用close，一次读取整个文件，并将结果整体作为一个str返回with open(r'ml-1m\ratings.dat') as f: ...

2018-03-23 11:02:43 193

原创 python operator之getitem和itemgetter

itemgetter(k)用于获取对象那些维的数据，是定义可一个函数，待获取的数据需要作为参数传入该函数，K只有一个值得时候，返回得是列表，多个值返回的就是元组getitem(boj,k)获取boj的k维的数据，可直接获得数据import operatortestlist=[[1,2,3],[4,5,6,7,89],[8,9,7,45]]b=operator.itemgetter(1)pri...

2018-03-22 10:44:38 831

原创基本数据结构的python实现

【1.栈结构的python实现】栈，线性数据结构，LIFO后进先出，添加和删除总是发生在同一侧。例如：盘子的堆放和拿取代码：【2.队列】队列，FIFO,先进先出，新添加的在队尾，移除的一端称队首，例如：排队分析：python实现中，队列尾部在列表位置0，首部在列表末尾，意味着，插入操作是O(n),删除操作是O（1）代码：【3.双端队列】deque,双端队列，类似于队列，有两个端部，首部和尾部，项在...

2018-03-18 17:39:29 417

原创排序和搜索（九）——快速排序的python实现

【理解】快速排序是分治法的典型，我们首选一个枢轴值，枢轴值的作用是作为比较对象将列表划分为大于它的一部分和小于他的一部分【分析】（1）分区总是出现在列表中间，则分区就可类比二分查找是O（logn）;为了找到分割点，需要针对枢轴值检查 n 个项中的每一个。结果是 nlog⁡n(2)最坏的情况，就是在首或尾分区，此时O(n^2)【中值三技术】选择枢纽值【代码】1.简单的我们将枢轴值设置在列表第一个2....

2018-03-16 21:04:21 159

原创 movielens数据集读取、转换

【1】从https://grouplens.org/datasets/movielens/上下载数据集，包含6000用户，4000多电影的100万条数据【读数据】import pandas as pdimport numpy as npusers_Name=['user_id','gender','age','work','zip']ratings_Name=['user_id','movi...

2018-03-16 15:38:50 7338 3

原创 python划分训练集和测试集

【第一种】方法def splitData(data,seed,m,k): #将数据分成训练集和测试集，每次指定seed，更换K,重复M次,防止过拟合. test=[] train=[] #random.seed(seed),指定seed的话，每次后面的随机数产生的都是一样的顺序 np.random.seed(seed) for user,item in...

2018-03-16 15:36:12 19917 1

原创排序和搜索（八）——归并排序的python实现

【基本原理】归并排序是一种递归算法，不断将列表拆分为一半。如果列表为空或有一个项，则按进行排序。如果列表有多个项，我们分割列表，并递归调用两个半部分的合并排序。一旦对这两半排序完成，就执行称为合并的基本操作。合并是获取两个较小的排序列表并将它们组合成单个排序的新列表的过程。【分析】一分为二的过程：类似于二分查找，时间复杂度为O（logn）合并过程：大小为 n 的列表的合并操作需要 n 个操作。...

2018-03-14 20:42:23 167

原创字典的遍历方法+反序列化

[承接]http://blog.csdn.net/brave_jcc/article/details/79529012#python字典遍历的几种方法#遍历key# 1for key in model: print('键4',key,'-----','值:',model[key]) # 2print('#############################')for key...

2018-03-12 16:49:44 315

原创统计元素个数+字典存入文件（通过序列化）的python实现

[背景]练手，想简单统计一下元素个数。保存成字典形式以后，想要长久的保存下来，方便以后使用，还是得通过序列化，python当中的列表、字符串、字典等数据类型都可以通过序列化以二进制序列形式在网络上传送，便于传输，便于存储。序列化以后，要读取序列内容可以通过反序列化形式pickle.load(f)或者pickle.loads()【知识点】序列化、文件读取、列表、字典和集合操作import pickl...

2018-03-12 16:43:54 1322

原创排序和搜索（三）——hash查找之冲突解决（2）

在http://blog.csdn.net/brave_jcc/article/details/79499336中提到了几种hash函数，但是也只是最大可能减少冲突，并未真正解决冲突问题，本文主要介绍几种常见的冲突解决方法（1）开放寻址+线性探测在遇到冲突的时候，尝试查找另一个空槽用以保存导致冲突的数据值。一个简单的方法是从原始哈希值位置开始，然后以顺序方式移动槽，直到遇到第一个空槽。注意，我们可...

2018-03-10 10:44:32 298

原创排序和搜索（三）——hash查找之hash函数(1)

在之前的（一）顺序查找和（二）二分查找中我们都是基于数据在列表中存储的索引位置查找的，本文所要说的是基于hash表的查找【hash表】又名散列表，是一种根据关键码寻找值的数据映射结构。哈希表的每个位置，通常称为槽，对应存储一个项，由0开始，如图所示是一个size为10的哈希表，最初每个槽中没有值，均为None.【hash函数】又称为散列函数，是数据值与哈希表之间的映射函数。哈希函数接收数据值，返回...

2018-03-10 10:15:39 387

原创 pip安装使用

python3.5版本安装的时候顺便把pip安装了，因为通过pip安装真的是又快又好pip安装完毕之后，打开cmd输入 pip（如果pip安装成功之后，会有一大堆cmd显示）输入pip install 包名等待安装成功pip 版本更新python -m pip install --upgrade pip查询模块DOS下进入python,然后导入相应的模块名，help（模块名.方法名)即可查询方...

2018-03-08 10:22:12 261

原创 python学习笔记——numpy

补充tile(val,(x,y))将val内容复制x行，y列。val可以使单个值，也可以是列表shape()查看矩阵或者数组的维数；如果是一个值，返回'()';如果存在x行，y列，返回'(x,y)';含有n个值得一维数组，返回'(n,)'。d.shape、shape(d)np.argsort()返回的是对一个数组按照从小到大排序的索引数组，例arr1=np.array([6,5,-7,89,1])...

2018-03-08 10:20:27 320

原创 python学习笔记——pandas

from pandas import Series,DataFrameimport pandas as pdimport numpy as np 行用0，列用1(一) Series一种类似一维数组的对象，由一组数据（各种numpy数据类型）以及一组与之相关的数据标签（即索引）组成1.创建seriesObj1=Series([1,2,3,4])#不指定索引会自动添加从0到len（obj）-1pr...

2018-03-08 10:19:37 301

原创 python学习笔记——数据规整化：清理、转换、合并、重塑

一、合并数据集代码merge（如果没有通过on指定按哪个列进行连接，就默认按照重叠的列名进行连接默认是inner，还可以是 left、right、outer，通过how参数赋值指定如果根据多个键进行个并，传入这些列构成的列表suffixes,用于追加到重叠列名的末尾索引参于合并，就是left_index、right_index 是否为True）df1=DataFrame({'key':['b','...

2018-03-08 10:16:37 214

转载 python算法分析---查找和排序总结

对于有序和无序列表，顺序搜索是 O(n)。在最坏的情况下，有序列表的二分查找是 O(log^n )。哈希表可以提供恒定时间搜索。冒泡排序，选择排序和插入排序是 O(n^2 )算法。shell排序通过排序增量子列表来改进插入排序。它落在 O(n) 和 O(n^2 ) 之间。归并排序是 O(nlog^n ），但是合并过程需要额外的空间。快速排序是 O(nlog^n ），但如果分割点不在列表中间附近，可...

2018-03-01 21:38:41 269

原创排序和搜索（六）——插入排序的python实现

【插入排序】有这么一组数25,46,89,75，32。第一个数25先放在第一个位置，不管。25 再看第二个数46，与前面25比较，大，顺理成章放在第二个位置。2546 再看第三个数89，与邻近的前面的46比较，大，由于前面已经排好序，故推出比25也大，放在第三个位置254689 再看第4个数75，与邻近的前面的89比较，小，89后移。再往前比，与邻近的前面的46比较，大类推，放在46和...

2018-03-01 15:50:24 112

原创排序和搜索（五）——选择排序的python实现

选择排序：先指定最大数据所在的位置为0，第一次遍历比较其他位置数据与0上数据的大小，如果大于，则替换改位置为最大数据位置，遍历结束，交换数据（python列表为最大数据与列表最后数据交换）。回到初始指定位置0，进行第二次遍历（第一次遍历得出的最大数据不参与第二次遍历），直至剩列表最后一个数据【分析】虽然和冒泡排序一样，选择排序的时间复杂度仍然是O（n^2）,但是数据交换次数比冒泡排序要少~~【数据...

2018-03-01 10:58:51 153

原创排序和搜索（二）——python实现二分查找

【基本原理】在上一篇有序列表的顺序查找中，我们假定列表是按照值排好序的，基于排序的列表，我们按照python列表索引从头开始比较。而在二分查找中，我们先取中间索引位置，如果找到就返回；没找到（升序排序），如果中间位置的值大于待查项，则排除中间位置的值和比中间位置值大的另一半元素，如果待查项在列表中，肯定存在于小的半部分。重复此过程知道找到，返回；反过来也一样【二分查找分析】列表有n项，第1次比较剩...

2018-02-28 11:25:23 575

原创排序和搜索（一）——python实现顺序查找

【基本原理】当数据存储在诸如列表的集合中时，我们就说它具有线性或顺序关系。在python列表中，数据项存储的位置是单个索引值，并且索引值是有序的，顺序查找就可以按照索引顺序逐个比较，直到找到或者遍历整个列表【无序列表查找分析】图片来自：problem-solving-with-algorithms-and-data-structure-using-python【代码】#假定是无序排列def seq...

2018-02-28 10:27:04 1447 1

brave_jcc的博客