自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(63)
  • 收藏
  • 关注

原创 我的常规配置

清华源:-i https://pypi.tuna.tsinghua.edu.cn/simple

2020-05-12 16:46:36 256

原创 逻辑回归

Logistic Regressionhint:线性模型LR(没有考虑特征间的关联)——>LR +多项式模型(特征组合,不适用于特征稀疏场景,泛化能力弱)——>FM(适用于稀疏特征场景*,泛化能力强)——>FFM【省去零值特征,提高FFM模型训练和预测的速度,这也是稀疏样本采用FFM的显著优势】提到LR,需要先从线性回归模型进行讲解1.线性回归模型定义:给定数据集D={(x1, y1), (x2, y2), … },我们试图从此数据集中学习得到一个线性模型,这个模型尽可能准确地反

2021-03-24 10:35:11 114

原创 决策树总结

记录决策树模型基础知识与发展决策树基础概念决策树是一种基本的分类和回归方法。决策树的学习通常包括三个步骤:特征选择、决策树的生成和决策树的修剪。信息增益在信息论和概率统计中,熵(entropy)是对随机变量不确定性\textbf{随机变量不确定性}随机变量不确定性的度量X是一个取有限个值的离散随机变量,P(X=xiX=x_{i}X=xi​)=pip_{i}pi​,i=1,2…,n.随机变量的熵定义为:H(X)=−∑i=1npilogpi-\sum_{i=1}^{n}p_{i}log p_{i}−

2021-03-24 10:31:25 164

原创 Lightgbm的使用(未完待续)

本文用于记录Lightgbm的使用,使用包含两种,原生lightgbm与以scikit learn的接口方式来使用lightgbm1.原生方式lightgbm.train(params, train_set, num_boost_round=100, valid_sets=None, valid_names=None, fobj=None, feval=None, init_model=None, feature_name=’auto’, categorical_feature=’auto’, earl

2020-06-05 21:09:01 274

原创 FFM模型解读

1.概要FFM全称为:field-aware factorization machines,相比于FM模型,FFM引入了field的概念,特征可以被归类到field中。文章中举了一个例子,ESPN、Vogue和NBC同属于field出版商,Nike、Gucci和Adidas属于field 广告商,FFM可以利用这些信息,以下面的例子作进一步说明在FM模型中,FM的信息包含:wESPN∗wNike+wESPN∗wMale+wNike∗wMalew_{ESPN}*w_{Nike}+w_{ESPN}*w_{

2020-05-24 18:33:13 1498

原创 pandas笔记

1.使用pd.read_table(file)来读取txt格式数据2.使用pd.read_excel(file)来读取xls或xlsx格式的数据3.pd.Series(values, index,name,dtype)来新建一个pandas的基本数据类型4.df = pd.DataFrame({‘col1’:list(‘abc’), ‘col2’:range(0,3), ‘col3’:[1.1,2.2,3.3]}, index=list(‘一二三’))5.修改行或列名df.rename(inde

2020-05-19 23:05:50 174

原创 FM模型

1. 概要(1)FM模型使用分解的系数,适合在高稀疏度的数据下估计特征之间的联系,并且可以在线性的时间内计算出结果,同时FM可以直接优化而不依靠支撑向量(2)与现有的其他分解模型比较来讲,FM模型更易应用。FM模型可以在任何实数特征向量上实现,但其他模型只能在受限制的数据下使用。2. FM通过下图进行分析,数据的存储方式如下,物理含义是下面有说明,数据具有较大的稀疏度。   用这个数据...

2020-05-13 21:47:31 667

原创 Adaboost算法

文章目录1.Adaboost算法简介2.原理推导3.算法实现1.Adaboost算法简介\hspace*{0.6cm}AdaBoost,英文全称为"Adaptive Boosting"(自适应增强),是一种机器学习方法,AdaBoost方法的自适应在于:AdaBoost方法对于噪声数据和异常数据很敏感。AdaBoost方法中使用的分类器可能很弱(比如出现很大错误率),但只要它的分类效果比随机好...

2020-04-19 11:12:44 225

原创 LDA原理与实现

文章目录1.LDA原理1.1 概念1.2 公式推导2.LDA实现参考资料1.LDA原理1.1 概念LDA全称为Linear Discriminant Analysis,中文为线性判别分析。与PCA的作用相同,LDA的作用是降维,但是区别是PCA是无监督降维,而LDA是有监督的降维,LDA可以利用训练数据的类别标签。PCA只需要将数据映射到方差最大的空间,LDA需要将类别相同的数据尽可能靠近,...

2020-04-06 23:03:11 1116

原创 PCA(降维)原理与实现

1.PCA原理1.1概念PCA英文全名为Principal components analysis,主成分分析。PCA的作用是降维,利用正交变换来对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分。PCA是无监督的降维方法,主要思想是将数据映射到维度更低的空间,这样可以减少对这些数据进行计算的计算量,同时进行PCA操作后也要保证数据易于进...

2020-03-27 15:00:39 6816

原创 Gradient Descient 小demo

数据:x_data=[338,333,328,207,226,25,179,60,208,606]y_data=[640,633,619,393,428,27,193,66,226,1591]import matplotlib.pyplot as pltimport numpy as npx_data=[338,333,328,207,226,25,179,60,208,606]y_...

2019-08-27 16:50:17 113

原创 Python查看和新建excel文件

1.使用的工具包xlwt:写excel文件,包括新建excel文件、sheet、在excel中写内容xlrd:读取excel文件内容这上面两个工具包具体功能可查相应官方文档2.写excel文件实例import xlwt# 设置表格样式def set_style(name,height,bold=0): style=xlwt.XFStyle() font=xlwt.Fo...

2019-07-31 23:17:46 3370

原创 爬虫爬取豆瓣TOP250电影的信息1

输出的电影信息包括电影名,导演名,主演名,上映年份,归属国家,电影分类和评分import requestsfrom bs4 import BeautifulSoupdef get_movies(): name_list=[] eName_list=[] dirName_list=[] starName_list=[] year_list=[] ...

2019-07-31 16:26:04 546 1

原创 python读写文本文件的总结

python读取文件的主要步骤为:1.打开文件2.读取文件3.关闭文件首先给出一个简单的读文本文件样例:f=open('file.txt','r')try: text=f.read()finally: f.close()在上述的代码中,首先使用open()方法打开文件,open()方法有两个参数,第一个是文件名,第二个是文件的打开模式(默认为‘r’,即为读)其中...

2019-07-28 15:17:57 339

原创 问题 I: 毕业bg

题目描述每 年毕业的季节都会有大量毕业生发起狂欢,好朋友们相约吃散伙饭,网络上称为“bg”。参加不同团体的bg会有不同的感觉,我们可以用一个非负整数为每个 bg定义一个“快乐度”。现给定一个bg列表,上面列出每个bg的快乐度、持续长度、bg发起人的离校时间,请你安排一系列bg的时间使得自己可以获得最 大的快乐度。例如有4场bg:第1场快乐度为5,持续1小时,发起人必须在1小时后离开;第2场...

2019-03-13 19:41:54 268

原创 问题 G: 点菜问题

题目描述北大网络实验室经常有活动需要叫外买,但是每次叫外买的报销经费的总额最大为C元,有N种菜可以点,经过长时间的点菜,网络实验室对于每种菜i都有一个量化的评价分数(表示这个菜可口程度),为Vi,每种菜的价格为Pi, 问如何选择各种菜,使得在报销额度范围内能使点到的菜的总评价分数最大。注意:由于需要营养多样化,每种菜只能点一次。输入输入的第一行有两个整数C(1 <= C <= ...

2019-03-10 19:58:04 135

原创 问题 F: 放苹果

题目描述把M个同样的苹果放在N个同样的盘子里,允许有的盘子空着不放,问共有多少种不同的分法?(用K表示)5,1,1和1,5,1 是同一种分法。输入第一行是测试数据的数目t(0 <= t <= 20)。以下每行均包含二个整数M和N,以空格分开。1<=M,N<=10。输出对输入的每组数据M和N,用一行输出相应的K。样例输入26 37 2样例输出74一开...

2019-03-10 19:32:54 226

转载 杭电ACM试题分类

第一篇1001 这个就不用说了吧1002 简单的大数1003 DP经典问题,最大连续子段和1004 简单题1005 找规律(循环点)1006 感觉有点BT的题,我到现在还没过1007 经典问题,最近点对问题,用分治1008 简单题1009 贪心1010 搜索题,剪枝很关键10111012 简单题1013 简单题(有个小陷阱)1014 简单题1015 可以看作搜索题吧...

2019-03-10 16:32:32 138

原创 问题 D: Coincidence

题目描述Find a longest common subsequence of two strings.输入First and second line of each input case contain two strings of lowercase character a…z. There are no spaces before, inside or after the strin...

2019-03-09 11:55:47 172

原创 问题 C: 合唱队形

题目描述N位同学站成一排,音乐老师要请其中的(N-K)位同学出列,使得剩下的K位同学不交换位置就能排成合唱队形。合唱队形是指这样的一种队形:设K位同学从左到右依次编号为1, 2, …, K,他们的身高分别为T1, T2, …, TK,则他们的身高满足T1 < T2 < … < Ti , Ti > Ti+1 > … > TK (1 <= i <=...

2019-03-09 11:17:44 1303

原创 问题 B: 拦截导弹

题目描述某国为了防御敌国的导弹袭击,开发出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能高于前一发的高度。某天,雷达捕捉到敌国的导弹来袭,并观测到导弹依次飞来的高度,请计算这套系统最多能拦截多少导弹。拦截来袭导弹时,必须按来袭导弹袭击的时间顺序,不允许先拦截后面的导弹,再拦截前面的导弹。输入每组输入有两行,第一行,输入雷达捕捉...

2019-03-09 10:15:19 397

原创 问题 C: 货币系统

题目描述母牛们不但创建了他们自己的政府而且选择了建立了自己的货币系统。[In their own rebellious way],,他们对货币的数值感到好奇。传统地,一个货币系统是由1,5,10,20 或 25,50, 和 100的单位面值组成的。母牛想知道有多少种不同的方法来用货币系统中的货币来构造一个确定的数值。举例来说, 使用一个货币系统 {1,2,5,10,…}产生 18单位面值...

2019-03-08 20:04:09 1088

原创 问题 B: 采药

题目描述辰辰是个天资聪颖的孩子,他的梦想是成为世界上最伟大的医师。为此,他想拜附近最有威望的医师为师。医师为了判断他的资质,给他出了一个难题。医 师把他带到一个到处都是草药的山洞里对他说:“孩子,这个山洞里有一些不同的草药,采每一株都需要一些时间,每一株也有它自身的价值。我会给你一段时间, 在这段时间里,你可以采到一些草药。如果你是一个聪明的孩子,你应该可以让采到的草药的总价值最大。”如果...

2019-03-08 19:16:15 128

原创 问题 A: 装箱问题

题目描述【问题描述】有一个箱子的容量为V(V为正整数,且满足0≤V≤20000),同时有n件物品(0的体积值为正整数。要求从n件物品中,选取若干装入箱内,使箱子的剩余空间最小。输入:1行整数,第1个数表示箱子的容量,第2个数表示有n件物品,后面n个数分别表示这n件物品各自的体积。输出:1个整数,表示箱子剩余空间。【输入输出样例】输入:24 6 8 3 12 7 9 7输出:0...

2019-03-07 20:35:55 162

原创 问题 A: 【字符串】最长回文子串

题目描述输入一个字符串,求出其中最长的回文子串。子串的含义是:在原串中连续出现的字符串片段。回文的含义是:正着看和倒着看相同。如abba和yyxyy。在判断回文时,应该忽略所有标点符号和空格,且忽略大小写,但输出应保持原样(在回文串的首部和尾部不要输出多余字符)。输入字符串长度不超过5000,且占据单独的一行。应该输出最长的回文串,如果有多个,输出起始位置最靠左的。输入一行字符串,字符串长度...

2019-03-07 19:23:56 421 1

原创 问题 A: 最长公共子序列

题目描述给你一个序列X和另一个序列Z,当Z中的所有元素都在X中存在,并且在X中的下标顺序是严格递增的,那么就把Z叫做X的子序列。例如:Z=<a,b,f,c>是序列X=<a,b,c,f,b,c>的一个子序列,Z中的元素在X中的下标序列为<1,2,4,6>。现给你两个序列X和Y,请问它们的最长公共子序列的长度是多少?输入输入包含多组测试数据。每组输入占一行...

2019-03-06 15:54:34 80

原创 问题 A: 最长上升子序列

题目描述一个数列ai如果满足条件a1 < a2 < … < aN,那么它是一个有序的上升数列。我们取数列(a1, a2, …, aN)的任一子序列(ai1, ai2, …, aiK)使得1 <= i1 < i2 < … < iK <= N。例如,数列(1, 7, 3, 5, 9, 4, 8)的有序上升子序列,像(1, 7), (3,

2019-03-05 20:46:50 176

原创 问题 A: 最大连续子序列

题目描述给定K个整数的序列{ N1, N2, …, NK },其任意连续子序列可表示为{ Ni, Ni+1, …, Nj },其中 1 <= i <= j <= K。最大连续子序列是所有连续子序列中元素和最大的一个,例如给定序列{ -2, 11, -4, 13, -5, -2 },其最大连续子序列为{ 11, -4, 13 },最大和为20。现在增加一个要求,即还需要输出该子序...

2019-03-05 19:53:01 423

原创 问题 C: Legal or Not

题目描述ACM-DIY is a large QQ group where many excellent acmers get together. It is so harmonious that just like a big family. Every day,many “holy cows” like HH, hh, AC, ZT, lcc, BF, Qinz and so on chat...

2019-03-03 20:23:17 164

原创 问题 B: 确定比赛名次

题目描述有N个比赛队(1<=N<=500),编号依次为1,2,3,。。。。,N进行比赛,比赛结束后,裁判委员会要将所有参赛队伍从前往后依次排名,但现在裁判委员会不能直接获得每个队的比赛成绩,只知道每场比赛的结果,即P1赢P2,用P1,P2表示,排名时P1在P2之前。现在请你编程序确定排名。输入输入有若干组,每组中的第一行为二个数N(1<=N<=500),M;其中N表示...

2019-03-03 20:06:12 398

原创 18年南大考研复试机试题第二题

农夫John的奶牛跑路了。将地图视作一条数轴,John的初始位置在s而奶牛的位置在t(0<=s,t<=100000)。John可以花费一分钟的时间使自己作如下移动:1 从点x移动到点x+12 从点x移动到点x-13 从点x移动到点x*2奶牛的位置一直在点t。现在给定s,t,要求John要追上奶牛最少需要几分钟。Sample Input:5 17Sample Output:...

2019-03-01 20:18:44 676

原创 18年南大考研复试机试题第一题

给出一棵满二叉树的先序遍历,有两种节点:字母节点(A-Z,无重复)和空节点(#)。要求这个树的中序遍历。输出中序遍历时不需要输出#。满二叉树的层数n满足1<=n<=5。Sample Input:ABC#D#ESample Output:CBADE#include<iostream>#include<string>using namespace st...

2019-03-01 20:17:55 1216 2

原创 问题 D: 继续畅通工程

题目描述省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可)。现得到城镇道路统计表,表中列出了任意两城镇间修建道路的费用,以及该道路是否已经修通的状态。现请你编写程序,计算出全省畅通需要的最低成本。输入测试输入包含若干测试用例。每个测试用例的第1行给出村庄数目N ( 1< N < 100 );随后的 N(N-1)...

2019-02-28 22:19:05 519

原创 问题 C: 畅通工程

题目描述省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可)。经过调查评估,得到的统计表中列出了有可能建设公路的若干条道路的成本。现请你编写程序,计算出全省畅通需要的最低成本。输入测试输入包含若干测试用例。每个测试用例的第1行给出评估的道路条数 N、村庄数目M (N, M < =100 );随后的 N 行对应村庄间道路...

2019-02-28 21:08:10 225

原创 问题 B: Freckles

题目描述In an episode of the Dick Van Dyke show, little Richie connects the freckles on his Dad’s back to form a picture of the Liberty Bell. Alas, one of the freckles turns out to be a scar, so his Ripl...

2019-02-28 20:21:27 407 2

原创 问题 A: 还是畅通工程

题目描述某省调查乡村交通状况,得到的统计表中列出了任意两村庄间的距离。省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可),并要求铺设的公路总长度为最小。请计算最小的公路总长度。输入测试输入包含若干测试用例。每个测试用例的第1行给出村庄数目N ( < 100 );随后的N(N-1)/2行对应村庄间的距离,每行给出一对正...

2019-02-28 18:50:45 89

原创 排列组合和八皇后问题

1.排列1.排列的定义:从n个不同元素中,任取m(m≤n,m与n均为自然数,下同)个元素按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列;从n个不同元素中取出m(m≤n)个元素的所有排列的个数,叫做从n个不同元素中取出m个元素的排列数,用符号 A(n,m)表示。2.计算公式:3.代码解释这短代码是输入一个数n(小于10),输出从1-n的所有排序的组合举个例子输入:...

2019-01-14 14:58:52 421

原创 pat甲级1002

#include<iostream>#include<string.h>#include<math.h>using namespace std;int main(){int m,n,count=0;double d;double a[1005]={0};for(int p=0;p<2;p++){cin>&gt...

2018-12-31 16:37:05 209

原创 pta1001

1001A+B Format(20 point(s))Calculatea+band output the sum in standard format -- that is, the digits must be separated into groups of three by commas (unless there are less than four digits).In...

2018-12-31 15:21:18 285

原创 最短路径算法

//点到点之间的最短距离算法#include<stdio.h>#define N 100int main(){int m,n;//n代表点的个数,m代表路线的数量int a[N][N];int dist[N],f[N];//用来存储最短距离int b,c,d;scanf("%d %d",&m,&n);for(int i=1;i<=n;i++)...

2018-01-14 09:51:26 263

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除