GrowingBrain-CSDN博客

转载【Datawhale|天池】心跳信号分类预测 (5) - 模型融合

目录融合方法分类关于 stacking 的补充资料stacking 和 blending 的区别经验总结参考资料融合方法分类模型融合是比赛后期一个重要的环节，大体来说有如下的类型方式。简单加权融合: 回归（分类概率）：算术平均融合（Arithmetic mean），几何平均融合（Geometric mean）；分类：投票（Voting) 综合：排序融合(Rank averaging)，log融合 stack.

2021-03-29 01:35:48 206

原创【Datawhale|天池】心跳信号分类预测 (4) - 模型之 XGBoost

本文主要分享自己总结的关于 xgboost 的笔记。基础知识基学习器 CARTRegression:L(yi,y^i)=(yi−f(xi))2Classification:Gini(D)=∑k=1Kpk(1−pk)=1−∑k=1Kpk2Regression: L(y_i, \hat y_i) = (y_i - f(x_i))^2 \\Classification: Gini(D) = \sum_{k=1}^K p_k(1-p_k) = 1 - \sum_{k=1}^K p_k^2Regres

2021-03-25 23:49:57 500

原创【Datawhale|天池】心跳信号分类预测 (3) - 特征工程 ☞ tsfresh 时序特征提取

目录导入包读取数据数据预处理使用 tsfresh 提取特征References导入包import pandas as pdimport numpy as npimport tsfresh as tsffrom tsfresh import extract_features, select_featuresfrom tsfresh.utilities.dataframe_functions import impute读取数据# 数据读取data_train = pd.read_csv("d

2021-03-23 00:11:56 598 1

原创【Datawhale|天池】心跳信号分类预测 (2) - 数据分析

Datawhale 和天池联合举办了【零基础入门数据挖掘-心跳信号分类预测】的入门赛事，比赛链接：https://tianchi.aliyun.com/competition/entrance/531883/introduction文章目录

2021-03-19 21:03:48 178

原创【Datawhale|天池】心跳信号分类预测 (1) - Baseline

Datawhale 和天池联合举办了【零基础入门数据挖掘-心跳信号分类预测】的入门赛事，比赛链接：https://tianchi.aliyun.com/competition/entrance/531883/introduction数据的读取首先，需要从比赛官网下载数据。假设就放在 data 目录下，加载数据：import pandas as pdimport numpy as nptrain = pd.read_csv('data/train.csv')test = pd.read_cs

2021-03-17 00:41:47 276

转载 Datawhale 知识图谱组队学习之 Task 4 用户输入-＞知识库的查询语句

文章编写人：王翔特别鸣谢：QASystemOnMedicalGraph目录Datawhale 知识图谱组队学习之 Task 4 用户输入->知识库的查询语句目录一、引言二、什么是问答系统？2.1 问答系统简介2.2 Query理解2.2.1 Query理解介绍2.2.2 意图识别2.2.3 槽值填充三、任务实践四、主体类 EntityExtractor 框架介绍一、引言本部分任务主要是将用户输入问答系统的自然语言转化成知识库的查询语句，因此.

2021-01-15 00:32:03 127

原创 Neo4j fundamentals

Graph FundamentalsBasic concepts to get you going.A graph database can store any kind of data using a few simple concepts:Nodes - graph data recordsRelationships - connect nodesProperties - named data valuesA Graph DatabaseNeo4j stores data in a G

2021-01-13 23:29:05 80

转载基于医疗知识图谱的问答系统 - 操作介绍

基于医疗知识图谱的问答系统 - 操作介绍文章编写人：芙蕖特别鸣谢：QASystemOnMedicalGraph - Github一、引言该项目主要分为两部分：第一部分：搭建知识图谱。该部分的具体讲解将在 Datawhale 知识图谱组队学习之 Task 3 Neo4j图数据库导入数据进行介绍；第二部分：启动问答测试。构建一个简单的基于知识图谱的对话系统，该部分的具体讲解将在 Datawhale 知识图谱组队学习之 Task 4 用户输入->知识库的查询语句和 Dat

2021-01-12 22:12:36 838 1

原创 Neo4J 入门实践 - 安装、Cypher操作、Python调用Neo4j、数据导入

一、Neo4J 介绍与安装1.1 引言“工欲善其事，必先利其器”，知识图谱作为一种特殊的图结构，自然需要专门的图数据库进行存储。知识图谱由于其数据包含实体、属性、关系等，常见的关系型数据库诸如MySQL之类不能很好的体现数据的这些特点，因此知识图谱数据的存储一般是采用图数据库（Graph Databases）。而Neo4j是其中最为常见的图数据库。1.2 Neo4J 下载首先在 Neo4J官网下载 Neo4J Server。Neo4J分为社区版和企业版：企业版：收费，在横向扩展、权限控制

2021-01-11 22:29:25 2838 2

原创为什么扩大数据集可能导致分类效果下降？

本文目录0. 说明1. 问题背景2. 原因分析2.1 有没有可能是因为新数据的标签不够准确？2.2 是不是因为数据分布发生了变化？3. 举个栗子4. (强行)理论解释4.1 一种解释4.2 另一种解释5. 结论0. 说明由于是商业项目，一些数据不方便公开，但不影响文中列出的结果&结论，请谅解；若发现问题，或者有任何问题想交流，欢迎留言哦~1. 问题背景最近在做一个文本分类任务，遇到一个现象：在扩大了数据集之后，模型的分类准确率反而下降了，比较严重一个模型是下降了7个百分点左右。这很违

2020-08-09 23:31:53 12453 11

FastStoneCapturePortable

很巧小很好用的截图软件，我一直都用这个。它能截各种图形乃至手绘图形，也可以截滚动的屏幕，还可以录制视频。功能十分丰富。

2013-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人