自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 task6-网格搜索与模型融合

网格搜索与模型融合 任务: 1)进一步通过网格搜索法对3个模型进行调优(用5000条数据,调参时采用五折交叉验证的方式),并进行模型评估,展示代码的运行结果。(可以尝试使用其他模型) 2)模型融合,模型融合方式任意,并结合之前的任务给出你的最优结果。例如Stacking融合,用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分结果。 下面具体介绍网格搜索、交叉...

2019-04-16 00:38:23 635

原创 task5-LightGBM

Kaggle 上的比赛有一半以上的冠军方案都是基于 GBDT模型。 GBDT 在每一次迭代的时候,都需要遍历整个训练数据多次。如果把整个训练数据装进内存则会限制训练数据的大小;如果不装进内存,反复地读写训练数据又会消耗非常大的时间。尤其面对工业级海量的数据,普通的 GBDT 算法是不能满足其需求的。 LightGBM 提出的主要原因就是为了解决 GBDT 在海量数据遇到的问题,让 GBDT 可以更...

2019-04-14 23:58:08 212

原创 task4-LR+SVM

逻辑回归 支持向量机 支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学...

2019-04-13 12:57:01 222

原创 task3-word2vec

背景 想要让机器理解自然语言,首先肯定要找到一种方法将自然语言(符号)数学化,在机器学习中,比较常见的词表示方法是one-hot方法。 one-hot 是将用向量的形式来表示词,向量的维度是词表的长度,其中绝大多数元素为 0,只有一个维度的值为 1,这个维度就代表了当前的词;one-hot这种稀疏表示方式,表示的两个词的词向量是孤立的,不能从两个词的向量中看出两个词之间的语义关系;且如果词表过大,...

2019-04-10 00:49:22 155

原创 task2-TF-IDF

TF-IDF(termfrequency–inverse document frequency) TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。 TF(term frequency ):词频,指的是在给定的文件中,某一个给定的词语在该文件中出现的次数 IDF(inverse document frequency):逆向文件频率,这是一个词语“权重”...

2019-04-08 00:51:13 130

原创 MySQL 实战-day4

导入导出 按右键 选择导出向导

2019-04-07 09:51:15 68

原创 task1-数据初识(达观杯文本智能处理挑战赛练习)

数据说明 官网提供的数据包含两个csv文件:train_set.csv、test_set.csv train_set.csv 此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列: 第一列是文章的索引(id), 第二列是文章正文在“字”级别上的表示,即字符相隔正文(article); 第三列是在“词”级别上的表示,即词语相隔正文(word_seg); 第...

2019-04-05 20:09:48 262

原创 day3

2.1 MySQL 基础 (二)- 表操作 MySQL表数据类型 用SQL语句创建表 语句解释 设定列类型 、大小、约束 设定主键 用SQL语句向表中添加数据 语句解释 多种添加方式(指定列名;不指定列名) UPDATE 语句总是以要更新的表名开始。在这个例子中,要更新的表名为 Customers 。 SET 命令用来将新值赋给被更新的列。在这里, SET 子句设 置 cust_ema...

2019-04-04 17:14:41 127

原创 MySQL 基础 (一)- 查询语句--day2打卡

List item 导入示例数据库, 教程 SQL是什么?MySQL是什么? SQL是用于访问数据库的标准化语言; 数据定义语言包含定义数据库及其对象的语句,例如表,视图,触发器,存储过程等; 数据操作语言包含允许您更新和查询数据的语句; 数据控制语言允许授予用户权限访问数据库中特定数据的权限; 查询语句 SELECT FROM 语句解释:select * from ...

2019-04-02 23:43:14 138

原创 MySQL 软件安装及数据库基础

MySQL 软件安装及数据库基础软件安装数据库基础 软件安装 如果是第一次下载 , 从我前后安装三次的经验来看,比较建议下载 官网压缩包. 安装教程.:( 一定要先看教程!!!!!!) 如果不是第一次,而且需要卸载, 一定要注意保证卸载干净!!!!!! 卸载教程 需要补充的是: 如果按注册表上的目录查找不到mysql相关的注册表,一定要通过ctrl+R打开运行,输入regedit回车,ctrl+...

2019-03-31 21:28:09 78

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除