叫我小嘎子-CSDN博客

原创用户新增预测挑战赛（讯飞）高分baseline:0.85+，前10%

目前得分0.87+，开源一版0.85+的高分代码，方便大家学习。

2023-08-23 17:10:33 117 1

原创放弃csv，拥抱feather文件

一般比赛或者本地的表格文件多为.csv文件，这类文件动辄数个G，甚至上百G，并且读取的时间也较慢；因此有必要思考新型的存储文件格式来解决csv文件的问题；

2022-11-14 14:32:17 272

1.爬取豆瓣前250部电影由于电豆瓣电影中一共存在250部电影，需要进行分页，每隔25进行一次分页截取。# 构造分页数字列表page_indexs = range(0, 250, 25)headers表头为：headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 UBrowser/6.2.4098.3 Safar

2020-07-05 23:38:17 1305 1

原创强化学习（Reinforcement Learning）入门指南

什么是强化学习(Reinforcement Learning)强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验和监督学习区别监督学习需要大量的数据和其对应的正确标签，但是与强化学习来说它并没有数据和标签。方法：通过一次次在环境中的尝试, 获取这些数据和标签, 然后再学习通过哪些数据能够对应哪些标签, 通过学习到的这些规律, 尽可能地选择带来高分的行为 .

2020-06-26 16:50:45 199

原创力扣刷题

3-30 力扣解决动态规划等差数列2题1）368.最大整除数集思考：如果满足num[i]%nums[j]==0,那么就可以让这一组数列加1，即dp[i]=dp[j]+1def largestDivisibleSubset(self, nums: List[int]) -> List[int]: if not nums: return nums if l...

2020-03-30 15:54:31 153

原创错题总结

1.1.关于导致梯度消失和梯度爆炸的描述错误的是：激活函数使用sigmoid或者tanh可以缓解梯度消失在激活函数的选择的地方讲过，在深层网络中尽量避免选择sigmoid和tanh激活函数，原因是这两个激活函数会把元素转换到[0, 1]和[-1, 1]之间，会加剧梯度消失的现象。2一个在冬季部署的物品推荐系统在夏季的物品推荐列表中出现了圣诞礼物，我们可以推断该系统没有考虑到：标签偏移可以...

2020-02-19 20:56:30 193

原创数据分析师(工作)

从事数据分析（挖掘）一些工作需求

2019-07-24 15:45:51 106

原创数据挖掘总结(基于Python)

数据挖掘学习总结（第一次写，可能很多错误）自己总结的，可能会有很多错误，先更新一部分，主要学习（python）其中主要包括5个种类：数据、分类、回归、关联分析、异常检测数据0.数据包的导入数据挖掘的第一步就是各种数据包的导入,主要包括:%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib....

2019-07-16 16:40:43 839

qq946561354_xgl的博客