自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据挖掘第八周周报

第八周周报 本周主要工作是了解赛题,进行数据分析。下面是对数据的初步分析: base_info=pd.read_csv('train/base_info.csv')#企业的基本信息 annual_report_info=pd.read_csv('train/annual_report_info.csv')#企业的年报基本信息 tax_info=pd.read_csv('train/tax_info.csv')#企业的纳税信息 change_info=pd.read_csv('train/tax_inf

2020-11-17 17:02:00 199

原创 2020-11-03

数据挖掘实训 第六周周报 1. 决策树 ① 概念 决策树是以树状结构表示数据分类的结果 非叶子结点代表测试的条件,分支代表测试的结果。 ② 如何构建决策树 构造决策树的关键步骤是分裂属性。所谓分裂属性就是在某个节点处按照某一特征属性的不同划分构造不同的分支,其目标是让各个分裂子集尽可能地“纯”。尽可能“纯”就是尽量让一个分裂子集中待分类项属于同一类别。分裂属性分为三种不同的情况: 属性是离散值且不要求生成二叉决策树。此时用属性的每一个划分作为一个分支。 属性是离散值且要求生成二叉决.

2020-11-03 11:12:21 289

原创 2020-10-27

第五周周报 第五周主要学习了数据挖掘之特征选择。 目录 1. 特征选择目的 2. 常用的特征选择方法 3. 思考与总结 1. 特征选择目的 减少特征数量、降维,使模型泛化能力更强,减少过拟合。 增强对特征和特征值之间的理解。 2. 常用的特征选择方法 方法介绍:假设某特征店小二特征值只有0和1,并且在所有输入样本中,95%的实例的该特征取值是1,那就可以认为这个特征作用不大。如果100%都是1,那这个特征就没意义了。当特征值都是离散型变量的时候这种方法才能用,如果是连续型...

2020-10-27 10:39:08 188

原创 算法分析 | leetcode | 785. Is Graph Bipartite?

算法分析 | leetcode | 785. Is Graph Bipartite? 一、问题描述 Given an undirected graph, return true if and only if it is bipartite. Recall that a graph is bipartite if we can split it's set of nodes into two ...

2019-01-13 15:54:01 201

原创 算法分析 | 215. Kth Largest Element in an Array

算法分析 | 215. Kth Largest Element in an Array 这道题我在去年已经做过,当时是直接排序然后ac。现在想用分治法来解决。 一、问题描述: Find the kth largest element in an unsorted array. Note that it is the kth largest element in the sorted orde...

2019-01-13 15:25:40 124

原创 算法设计与分析leetcode作业第一周题解

divide-and-conquer 第一题 Maximum Subarray(53题) 题意: Given an integer array nums, find the contiguous subarray (containing at least one number) which has the largest sum and return its sum. Example: ...

2018-09-09 20:12:17 227

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除