自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 用户新增预测挑战赛(讯飞) 高分baseline:0.85+,前10%

目前得分0.87+,开源一版0.85+的高分代码,方便大家学习。

2023-08-23 17:10:33 117 1

原创 放弃csv,拥抱feather文件

一般比赛或者本地的表格文件多为.csv文件,这类文件动辄数个G,甚至上百G,并且读取的时间也较慢;因此有必要思考新型的存储文件格式来解决csv文件的问题;

2022-11-14 14:32:17 272

原创 数据挖掘全流程【EDA】

数据挖掘

2022-11-07 16:50:54 149

原创 爬取豆瓣电影,存储到mysql中,并进行数据分析

1.爬取豆瓣前250部电影由于电豆瓣电影中一共存在250部电影,需要进行分页,每隔25进行一次分页截取。# 构造分页数字列表page_indexs = range(0, 250, 25)headers表头为:headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 UBrowser/6.2.4098.3 Safar

2020-07-05 23:38:17 1305 1

原创 强化学习(Reinforcement Learning)入门指南

什么是强化学习(Reinforcement Learning)强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验和监督学习区别监督学习需要大量的数据和其对应的正确标签,但是与强化学习来说它并没有数据和标签。方法:通过一次次在环境中的尝试, 获取这些数据和标签, 然后再学习通过哪些数据能够对应哪些标签, 通过学习到的这些规律, 尽可能地选择带来高分的行为 .

2020-06-26 16:50:45 199

原创 力扣刷题

3-30 力扣解决动态规划等差数列2题1)368.最大整除数集思考:如果满足num[i]%nums[j]==0,那么就可以让这一组数列加1,即dp[i]=dp[j]+1def largestDivisibleSubset(self, nums: List[int]) -> List[int]: if not nums: return nums if l...

2020-03-30 15:54:31 153

原创 错题总结

1.1.关于导致梯度消失和梯度爆炸的描述错误的是:激活函数使用sigmoid或者tanh可以缓解梯度消失在激活函数的选择的地方讲过,在深层网络中尽量避免选择sigmoid和tanh激活函数,原因是这两个激活函数会把元素转换到[0, 1]和[-1, 1]之间,会加剧梯度消失的现象。2一个在冬季部署的物品推荐系统在夏季的物品推荐列表中出现了圣诞礼物,我们可以推断该系统没有考虑到:标签偏移可以...

2020-02-19 20:56:30 193

原创 数据分析师(工作)

从事数据分析(挖掘)一些工作需求

2019-07-24 15:45:51 106

原创 数据挖掘总结(基于Python)

数据挖掘学习总结(第一次写,可能很多错误)自己总结的,可能会有很多错误,先更新一部分,主要学习(python)其中主要包括5个种类:数据、分类、回归、关联分析、异常检测数据0.数据包的导入数据挖掘的第一步就是各种数据包的导入,主要包括:%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib....

2019-07-16 16:40:43 839

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除