自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ysheng

Most people overestimate what they can accomplish in a year - and underestimate what they can achieve in a decade! ​​​​

  • 博客(11)
  • 收藏
  • 关注

原创 OGeek算法挑战赛总结

断断续续地结束了这个比赛,对我而言,这是入门自然语言处理的第一课,也是搜索推荐中,根据用户query与预测列表prediction_List,预测用户的点击率。参赛总结:1. 首先,json、list相加、读写文件以及一些pandas的操作,都需要用的足够多,才会越熟练。2. 这次遇到的两个最大的挑战是:1)数据泄露;2)进行groupby后,样本乱序对结果产生影响。3. 数据泄露...

2018-11-07 11:52:24 1400 1

原创 Python使用总结(2)

继续接着上次的,总结这段时间在使用Python过程中遇到的问题与解决方法。1. 正则表达式的使用(re)import re# 表达式编译pattern = re.compile(r'^1[35789]\d{9}$') # 如果存在匹配结果为True,否则为Falsepattern.match(inst)2. 在数据量特别大时,直接使用dataframe分片的效率优于使用gr...

2018-10-16 20:55:29 354

原创 Python使用总结(1)

机器学习的编程语言,相较于R,python好像更容易一些,函数式编程也挺形象。但是,每一门语言都有一些自己约定俗成的特点,更别说那些接口、包的使用。这些在具体的使用中,会让人焦头烂额。这篇博客是总结我这段时间使用python的一些经验,并不是python的特点总结,只是总结一些我遇到的坑和解决方法,以及我对于python的理解。1.将时间戳转成格式化的时间表示(datetime)t...

2018-10-16 20:55:11 259

原创 感知机模型[实现]

感知机模型:感知机学习策略:通过改变w,b,使损失函数最小感知机学习算法:随机梯度下降(每次仅对一个误分点进行学习)import numpy as npdef f(w, x, b): y = np.sum(np.dot(w, x)) + b if y > 0: return 1 return -1def loss(w, x, ...

2018-09-30 15:34:29 422

原创 java实现深度优先搜索(以含重复元的全排列为例)

java在实现多次调用函数,由函数中间结果产生全局解时,需要定义一个全局变量,用于跟踪结果并随时保存。C++可以使用指针完成此操作,而不需要定义全局变量。题目:含有重复元的全排列import java.util.ArrayList;import java.util.Arrays;public class permutation_ii { static ArrayList&l...

2018-08-24 15:39:42 327

原创 美团2017CodeM初赛A轮题解[C题]

合并回文子串题意:输入两个字符串A和B,合并成一个串C,属于A和B的字符在C中顺序保持不变。如"abc"和"xyz"可以被组合成"axbycz"或"abxcyz"等。求最长回文子串的长度(回文串表示从正反两边看完全一致的字符串,如"aba"和"xyyx")。...

2018-05-28 14:36:23 532

原创 美团2017CodeM初赛A轮题解[E题]

数列互质题意:给出一个长度为 n 的数列 { a[1] , a[2] , a[3] , ... , a[n] },以及 m 组询问 ( l[i] , r[i], k[i])。 求数列下标区间在 [ l[i] , r[i] ] 中有多少数在该区间中的出现次数与 k[i] 互质(最大公约数为1)。输入描述:第一行,两个正整数 n , m (1 ≤ n, m ≤ 50000)。第二行,n 个正整数 a...

2018-05-27 21:30:19 354

原创 美团2017CodeM初赛A轮题解[D题]

美团2017CodeM初赛A轮题解[D题]题意:n个人排成一列跑步,前后两人之间相隔 u 米,每个人正常速度均为 v 米/秒。 当某个配送员排在最后的时候,他需要以当时自己的最高速度往前跑,直到超过排头的人 u 米,然后降回到原始速度 v米/秒。每个人最初的最高速度为c[i] 米/秒,每轮衰减d[i]米/秒,也就是说,如果i是第j个跑的,那么他的速度就是c[i]-(j-1)*d[i] 米/秒。 n...

2018-05-27 21:16:45 236

原创 美团2017CodeM初赛A轮题解[A题]

美团2017CodeM初赛A轮题解[A题]题意:有一个大水缸,里面水的温度为T单位,体积为C升。另有n杯水(假设每个杯子的容量是无限的),每杯水的温度为t[i]单位,体积为c[i]升。现在要把大水缸的水倒入n杯水中,使得n杯水的温度相同,请问这可能吗?并求出可行的最高温度,保留4位小数。 注意:一杯温度为t1单位、体积为c1升的水与另一杯温度为t2单位、体积为c2升的水混合后,温度变为(t1*c1...

2018-05-27 20:52:26 765 1

原创 美团2017年CodeM资格赛题解

最近想要参加今年的CodeM竞赛,所以把去年的题做了一遍,顺便写个题解,做个记录。资格赛有A-F,共6道题,资格赛不限时,而且只要完成一道题就可以了。A、数码题意:给定两个整数 l 和 r ,对于所有满足1 ≤ l ≤ x ≤ r ≤ 10^9 的 x ,把 x 的所有约数全部写下来。对于每个写下来的数,只保留最高位的那个数码。求1~9每个数码出现的次数。示例1输入1 4输出421100...

2018-05-23 13:28:46 839 3

原创 Lightgbm调参经验

一周前开始接触Lightgbm,关于它的原理和主要思想很多地方都有,这里就不再赘述。这篇博文是我在参加天池数据挖掘比赛时的Lightgbm调参经验总结,希望对后续的工作有帮助。1. 数据特征选择除了数据集中的基本数据特征外,很多时候还需要从基本数据特征中通过统计或组合获得新的特征,这时候获得的新特征与原来的基本数据特征之间存在着相关性。新特征可能作为基本特征的补充更好地划分数据集,可能与原...

2018-04-23 13:40:36 8294 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除