自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 问答 (1)
  • 收藏
  • 关注

原创 数据常用code - 画图

plotlymode:该参数用于指定绘图模式,比如折线图('lines')、散点图('markers')等。name:设置图例中的名称。marker:用于设置数据点的样式,比如颜色、大小和符号。line:用于设置线条的样式,比如颜色、宽度和样式。text:用于指定数据点的文本标签。hoverinfo:设置鼠标悬停时显示的信息,可以包括数据值、标签等。layout:用于设置整个图表的布局信息,包括标题、轴标签、背景颜色等。title:用于设置图表的标题。

2024-04-21 23:55:13 174

原创 数分常用code - notebook

【代码】数分常用code - notebook。

2024-04-21 23:51:19 177

原创 github笔记-远端仓库branch操作

git reset --hard origin/[分支名],直接覆盖本地内容。2. git reset --hard [commit_id],强制切到某个版本。1. git log,查看当前分支历史(没log就是切错分支/文件夹了)1. git push origin --delete [分支名]4. git pull origin [分支名],更新分支内容。6. git push -u origin [分支名]3. git branch,查看并切换到常规操作分支。4. 新建分支并在上面操作。

2023-08-22 22:55:09 92

原创 python笔记(三)pandas

merge 更灵活,可以指定连接的左右键值和连接方式,但是有重复的时候需要先用duplicate去重,比较新的python版本应该可以直接指定validate连接方式,更方便。pd.merge(df3, df4, left_on='lkey', right_on='rkey') #连接键可以指定一个/两个。pd.merge(df1, df2, how='outer') # 默认“内连接”inner取交集,outer外键去并集。独热编码:分类变量的每个类别都转换为一个新的二进制列(1/0)

2023-07-18 23:38:43 80

原创 python笔记(二)dataframe操作

x2 = df.loc[(df['利润中心(项目编号)']==i)&(df['品类']==j), ['方向','时间']]df.loc[(df['利润中心(项目编号)']==i)&(df['品类']==j), 'ans'] = '小'df.loc[(df['利润中心(项目编号)']==i)&(df['品类']==j), 'ans'] = '大'# data2[(data2['利润中心(项目编号)']==i)]['ans']=a['ans']但是, apply() 只允许与函数一起使用。

2023-07-18 23:37:47 287

原创 SQL笔记(三)字符串+日期

窗口函数只能在select命令中和select命令之后使用,不能在where中使用,其执行顺序是和select同级别的,位于distinct顺序之前,可以把窗口函数与分析函数结合后形成的看成select中字段一样,也是可以取别名的,是select的一部分。(str,str_before,str_after):将字符串str中所有的str_before用str_after。(param1,"$.param2"):解析json字符串param1中key为param2的字符串。日期转换为年、月、周、时、分、秒。

2023-07-17 22:52:04 151

原创 python笔记(一)notebook

运行代码块, 选择下面的代码块(在编辑模式下也可用)`x`剪切,`c`复制,`v`粘贴`a`: 在上面插入代码块`b`: 在下面插入代码块查看宏包版本——conda listsns.set()

2023-07-17 22:36:18 64

原创 SQL笔记(二)窗口函数示例

ql中有一类函数叫聚合函数,比如count、sum、avg、min、max等,这些函数的可以将多行数据按照规整聚集为一行,一般聚集前的数据行要大于聚集后的数据行。思路,利用窗口函数 ntile将每个用户和对应的支付金额分成5组(这样每组就有1/5),取分组排名第一的用户组即前支付金额在前20%的用户。例如,有3条排在第1位时,排序为:1,1,1,4······例如,有3条排在第1位时,排序为:1,1,1,2······例如,有3条排在第1位时,排序为:1,2,3,4······

2023-07-17 22:31:49 119

原创 SQL笔记(一)窗口函数

窗口函数 over (partition by 用于分组的组名,order by 用于排序的列名)排名函数:row_number() 连续不重复rank() 重复不连续dense_rank() 连续重复聚合函数:max() min() count() sum() avg() median()向前向后取值:lag(field,n,default) lead(field,n,default)百分位:percent()

2023-07-17 22:29:10 119

原创 python民用汽车保有量可视化(pyecharts1.9.1)

利用数据可视化作业的机会学了一下piecharts基本操作,记录一下避免下次踩坑。一开始没注意教程用的版本不一样,频频报错,浪费了很多时间。查看版本的方式:import pyechartspyecharts.__version__使用的是国家数据网站上的工业数据,可以直接下载先导入pyechartsimport pyecharts.options as optsfrom pyecharts.charts import Line, Bar, Pie1. 总体变化趋势作柱

2021-12-04 22:13:34 964

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除