自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 资源 (10)
  • 收藏
  • 关注

原创 Python开发笔试、面试及简历复盘:全面指南

Python开发笔试题目汇总、面试总结与技巧、简历撰写技巧等——全面指南

2024-04-07 21:44:57 811

原创 掌握基本排序算法:冒泡、选择、插入和快速排序

本文深入探讨了四种基础排序算法:冒泡排序、选择排序、插入排序和快速排序。它们各自的工作原理、效率(通过最好、平均和最坏情况下的时间复杂度进行衡量)以及最适应的使用场景被详细分析。冒泡排序和选择排序因其简单性适用于小规模数据集,尽管时间复杂度较高。插入排序在数据几乎已排序的情况下表现优异。快速排序作为一种高效的算法,通常提供最佳平均性能,但需要注意最坏情况的时间复杂度。文章强调了在实际应用中,根据数据的特性和需求选择合适排序算法的重要性,以优化程序性能。

2024-03-03 14:44:43 559

原创 Git管理秘籍:Python项目中的.gitignore策略

Python项目中常见的git配置策略

2024-01-25 16:44:02 1335

原创 防火墙管理入门:Firewalld 与 UFW

firewalld 与 ufw的区别与联系,以及相关的命令,查询状态、开启、关闭、永久关闭等

2024-01-10 11:21:05 1246 1

原创 队列的实现方式—Python数据结构(三)

队列(Queue)的定义与多种实现方式,包括顺序结构存储、链式结构存储等

2023-10-22 22:22:17 493

原创 堆和栈的区别以及栈的顺序存储和链式存储—Python数据结构(三)

本文主要讲了数据结构中的栈和堆,且主要分析了栈和堆的区别与联系,包括python中对象和引用的关系,最后使用Python代码实现栈的顺序存储和链式存储模型

2023-07-23 19:10:40 589

原创 线性表的顺序存储和链式存储—Python数据结构(二)

本文主要讲了数据结构模型—线性表,并用Python代码写了线性表的顺序存储和链式存储,最后有一个关于线性表的练习题。

2023-07-22 19:14:17 269

原创 Python—数据结构(一)

本章主要讲解数据结构的基本概念,包括定义,结构关系、存储结构和数据结构模型等。从Python角度方向出发,主要涉及频繁使用的相关模型和方法。

2023-07-22 18:52:33 333

原创 Python魔法方法总结

本章主要介绍当前Python使用频率比较高的各种魔法方法,且为每个魔法方法都有对应的代码案例。

2023-06-20 11:17:50 194

原创 Celery介绍及使用配置(Django环境)

Celery的使用及介绍,包含在django的开发环境或生产环境的配置。

2023-06-19 22:50:48 970 3

原创 jwt(JWT-Json-Web-Token)使用文档

Web中Cookie、session、jwt的详细说明,以及各个区别与联系和各优缺点。

2023-06-14 23:31:10 1336

原创 Git相关命令

git相关命令_主要介绍远程仓库绑定、本地分支与远程分支的创建、查询、删除、关联等

2023-05-26 19:00:45 84

原创 使用selenium爬取谷歌图片

使用Python的selenium和requests对谷歌图片进行批量爬取和下载,粘贴即可运行

2023-04-12 17:48:22 840 1

原创 Docker基本命令

Docker基本命令

2023-03-16 15:18:12 124

原创 Supervisor 进程管理

Supervisor简单使用,本文主要使用supervisor进程管理工具来管理nginx和uWSGI服务。图文并茂,具体详解。

2022-12-15 18:26:39 1917

原创 Ubuntu server 20.04安装JDK8.0

ubuntu server 20.04 安装jdk8,图文并茂,手把手教你

2022-12-04 13:40:41 1043 1

原创 Web系统版本更新与迭代方式——持续集成与持续部署(Python Django框架)

基于Web系统版本更新与迭代,简单集成与部署。通过手动更新方式或使用Git进行更新。

2022-11-30 23:10:19 1257

原创 ERROR: Could not find a version that satisfies the requirement pbr (from versions: none) ERROR:

安装 virtualenvwrapper时报错以及解决步骤:ERROR: Could not find a version that satisfies the requirement pbr (from versions: none) ERROR: No matching distribution found for pbr

2022-11-21 22:37:01 1247 3

原创 Django生产环境部署——Nginx和uwsgi详解(四)

Django开发应用网站部署上线,Nginx以及uwsgi的参数详解,WSGI、uWSGI和uwsgi三者的关系与区别!

2022-11-19 17:28:53 2318

原创 Django生产环境部署——Mysql8.0+Nginx+uwsgi安装(三)

本文详细讲解了Ubuntu20.04下安装mysql以及nginx和python web server的uwsgi安装与配置,包括其主要的使用命令。图文并茂。

2022-11-13 17:59:11 997

原创 Django生产环境部署——Python安装与虚拟环境的创建(二)

基于Ubuntu20.04 服务版安装和配置Python3.8,创建虚拟环境。图文教程。

2022-11-06 18:35:29 756

原创 Django生产环境部署—Ubuntu20.04 server安装(一)

基于Windos系统利用VirtualBox安装Ubuntu20.04服务版,最后配置远程连接,使用Tabby进行远程访问服务器。文章带有Ubuntu、Tabby和Virtual镜像下载网站。

2022-10-30 22:58:21 590

原创 Django框架学习—初级入门

Django框架学习,初级入门,基本的部署环境

2022-09-18 22:14:04 628

原创 Anaconda 创建虚拟环境相关命令

Anacondac虚拟环境的使用(添加、删除、及镜像源的设置)

2022-09-04 17:42:24 544

原创 Python之排序函数sort(),sorted(),sort_values(),sort_index().

Python之排序函数—sort(),sorted(),sort_values(),sort_index().

2022-08-20 23:01:05 13364 2

原创 数分/机器学习算法面试题(技术面)—总结

一、 *商科技公司二 欧洲艾盛集团ISV公司BI笔试题2.结构化思维考题:3.电商生态认知题三、闪****车新能源科技公司2. 一个箱子中有10个不同颜色的球,在里面随机取2~9个球,取出的球可能的组合有______种(填数字)3.一个人做一件事出错的概率是0.3,如果做两件事,他都做对的概率为_______3. 抛一个硬币出现正面的概率为0.3,出现反面的概率为0.5,还有0.2的概率会立起来,抛2个硬币,出现一正一反的概率为______4. 如果在A发生的

2022-05-29 21:48:44 3460 5

原创 (深度学习)前馈神经网络—全连接网络的一般流程

(深度学习)前馈神经网络——全连接网络的一般流程及相关算法、函数和实战

2022-03-27 17:27:04 4463 5

原创 Hivesql常用优化技巧

首先介绍下什么是HIve?1.基于Hadoop的开源的数据仓库工具,用于处理海量海量结构化数据。2.Hive把HDFS中的结构化的数据文件映射成数据表。3.Hive通过HiveSQL进行解析和转换,最终映射成一系列在hadoop上运行的mapreduce任务,通过执行这些任务完成分析和处理。4.HiveSql和Mysql一样,都遵循着SQL的标准,因此它们很多语句都是一样的。一、先复习下SQL的语句的结构SELECT * (必须)FROM 表(数据源)WHERE

2021-11-05 09:48:08 6018 2

转载 八大去监督异常检测技术

http://www.csuldw.com/2019/03/24/2019-03-24-anomaly-detection-introduction/?from=timeline&isappinstalled=0

2021-11-02 20:03:42 118

原创 机器学习之KNN算法(KD Tree方法)

一、KNN算法原理KNN(K-nearst neighbors)算法,又叫K近邻算法,它是一种有监督学习的机器学习算法。对新的实例,依据给定的距离公式(二维空间一般采用欧氏距离),根据其k个最近邻的训练实例的类别,通过多数表决的方式进行预测。意思就是说每个样本都可以用它最接近的k个邻居来代表。原理如图:原理:图中的数据集都已经分好了类,即打好了标签,一类是橙色的三角形,一类是蓝色的圆形,中间的六角形是待分类的数据1.如果K=5,那么离六边形最近的有三个三角形和两个圆形,因为三个三角形占优势,依据多

2021-10-22 22:08:43 1882

原创 Mysql中的 limit n,m和limit m offset n 的区别

Mysql 中的limit N,M 和 limit N OFFSET M的区别select * from user limit 1,3 意思是跳过一条 取三条数据||idname1张三2李四3王五4赵柳 limit 1,3 的结果就是跳过id为1的最终的结果是取得id为2,3,4的select * from user limit 3 offset 1o

2021-10-15 19:01:58 448

原创 Python之排序函数总结

一 .序列排序为:1.sorted(list,reverse=True) 在排序后会生成一个新的序列,不改变原有序列a=[2,7,4,9,2,7,1,6,3,5]sorted(a)输出:[1, 2, 2, 3, 4, 5, 6, 7, 7, 9]注意:默认是升序sorted(a,reverse=True)输出:[9, 7, 7, 6, 5, 4, 3, 2, 2, 1] 降序输出2.sort()排序后改变原有序列,不生成新的序列a=[1,3,2]a.sort()---->输出:

2021-09-16 18:20:00 8676

原创 tableau连接数据库时出现检查服务器是否正在运行以及您是否有权访问请求的数据库

tableau连接数据库时出现检查服务器是否正在运行以及您是否有权访问请求的数据库1.首先登入rootmysql -u root -p2.使用名为mysql的database use mysql3使用select host,user,plugin from user;查询user表中的plugin列查看密码4.更改使用ALTER USER ‘root’@‘localhost’ IDENTIFIED WITH mysql_native_password BY 'new_password’r

2021-08-29 11:13:48 1004

原创 hive之偏移分析窗口函数

说明:Lag和Lead分析函数可以在同一次查询中取出同一字段的前N行的数据(Lag)和后N行的数据(Lead)作为独立的列。在实际应用当中,若要用到取今天和昨天的某字段差值时,Lag和Lead函数的应用就显得尤为重要。当然,这种操作可以用表的自连接实现,但是LAG和LEAD与leftjoin、right join等自连接相比,效率更高,SQL语句更简洁。lag(exp_str,offset,defval) over(partion by ……order by ……)lead(exp_st

2021-08-15 18:08:17 2222

原创 hive之切片排序窗口函数

切片排序窗口函数ntile(n) over(……)ntile(n) over(partition by …A… order by …B… )n:切分的片数A:分组的字段名称B:排序的字段名称NTILE(n):用于将分组数据按照顺序切分成n片,返回当前切片值。NTILE不支持ROWS BETWEEN,比如 NTILE(2)OVER(PARTITION BY …… ORDER BY …… ROWSBETWEEN 3 PRECEDING AND CURRENT ROW)。如果切片不均匀,则

2021-08-15 18:01:21 853

原创 hive之分区排序窗口函数

row_number:它会为查询出来的每一行记录生成一个序号,依次排序且不会重复。rank&dense_rank:在各个分组内,rank()是跳跃排序,有两个第一名时接下来就是第三名,dense_rank()是连续排序,有两个第一名时仍然跟着第二名。需求1:2019年1月,用户购买商品品类数量的排名 select user_name,count(distinct goods_category),row_number()over(order by count(distinct good.

2021-08-15 16:54:50 254

原创 数据分析之RFM模型

一.均值 RFM模型算法从csv文件中读取相应的数据data=pd.read_csv('./dataset.csv',encoding='ISO-8859-1')#读取2014年的客户信息data_14=data[data['Order-year']==2014]data_142.获取相应的列data_14 = data_14[['CustomerID','OrderDate','Sales']]data_14 CustomerID为用户idOrderDate为下单日期Sal.

2021-08-14 18:45:34 1800

原创 大数据hive之表连接

高亮显示问题修改右下角格式为sql即可关于jps进程中的runjar解决办法kill -9 runjar进程号– win电脑不要在云实验平台中使用ctrl+c 复制内容su - root # 切换到root用户,并且使用root用户对应的环境变量– 注意在无论进行何种表链接时,一定要将各种表进行重命名,防止错误发生一 内连接join 和inner join 是相同的1.找出既在user_list_1也在user_list_2的用户:方法一:select *from user_list

2021-08-13 12:17:27 1642

原创 大数据之hive窗口函数基础查询

/电商项目高价值用户排名温馨提示:本次任务使用的数据在电商项目云实验平台中,数据库 kkb_da先使用 desc 表名;语句查看字段,在进行查询。1.查询 2020 年 GMV,按照月累计进行分析(使用 kkb_order 表)2.计算 2020 年 6 月份,每三天进行移动求平均注册用户数(使用 kkb_order 表)3.计算 2020 年 6 月份注册用户数排名前 3 名的城市(使用 kkb_order 表)/– 1.查询 2020 年 GMV,按照月累计进行分析(使用 kkb_order

2021-08-12 16:00:32 183

原创 大数据之hive 基础查询

/*电商项目基础查询温馨提示:本任务使用的云试验平台为上课时所用,非电商项目实验平台,数据库名 kaikeba先使用 desc 表名;语句查看字段,在进行查询。激活天数距今超过 500 天的男女分布情况(使用 user_info)(使用 user_info 表)不同性别、教育程度的用户分布情况(使用 user_info) (使用 user_info 表)2019 年前 4 个月中,全天各个时间段的不同品类购买金额分布(24 小时制,使用 user_trade 表)统计在 2018 年购买的商品

2021-08-11 16:59:27 265

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除