自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 问答 (1)
  • 收藏
  • 关注

原创 决策树模型

机器学习 | 决策树模型(一)理论机器学习 | 决策树模型(二)实例财务数据挖掘|识别企业税务合规存疑行为数据集:链接:https://pan.baidu.com/s/1t0QVUl4j821lrhVY-yTwDA提取码:1hcp

2021-08-14 17:04:52 142

原创 评分卡模型

初探机器学习与评分卡模型 基于Python的信用评分卡模型分析(一)基于Python的信用评分卡模型分析(二) 数据集:链接:https://pan.baidu.com/s/1fwXzHsn1VtUKWUcSrR4PLg提取码:9fxe 风险控制:信用评分卡模型风险控制:信用评分卡模型评分卡模型开发-基于逻辑回归的标准评分卡实现评分卡模型构建介绍评分卡模型剖析之一(woe、IV、ROC、信息熵)申请评分卡模型中常用的一些特征工程方法 ...

2021-08-12 17:17:53 186

原创 Exploratory Data Analysis

一、数据质量分析1、缺失值分析df.info()df.describe()# df.isna().sum()missing = df.isnull().sum().reset_index().rename(columns={0:'missNum'}) # 缺失值统计# df.isna().mean()missing['missRate'] = missing['missNum'] / df.shape[0] # 缺失值比例miss_analy = missing[missing.missR

2021-08-09 23:51:26 235 2

原创 数据库创建索引原则

mysql建立索引的几大原则Mysql索引创建原则关于mysql建立索引需要注意的几点事项mysql 多大数据量适合建索引?MySQL两表关联的连接表该如何创建索引?

2021-08-01 22:13:07 109

原创 数分模型整理v1.0.1

一、关联规则功能集/套餐/购物篮分析关联分析(一)关联规则(二)二、集成学习集成学习bagging三、聚类DBSCAN聚类k-means聚类在机器学习里,什么是凸样本集和非凸样本集?定义:存在两点的直线内的点有不属于集合S的点,集合S就称为凹集。…四、分类使用sklearn库:KNN算法bagging使用sklearn库:SVM反馈神经网络(MLP)Decision Tree(决策树分类)randomforest随机森林是一个包含多个决策树的分类

2021-07-26 20:19:23 415

原创 Mark几个问题

为什么朴素贝叶斯如此“朴素”?因为它假定所有的特征在数据集中的作用是同样重要和独立的。如何评价模型的好坏?如何评价模型的好坏?什么是「过拟合」,如何判断,常见的原因是什么?...

2021-06-15 20:28:52 87

原创 记个Linux的备忘录

拷贝TXT的特定行内容至新文件:从第5行开始,共拷贝5行cat filename.txt | tail -n +5 | head -n 5 > newfile.tx

2021-04-15 15:05:13 70

原创 产品经理入门

0 互联网产品从0到1全流程1 行业与市场分析第1步:确定行业规模行业规模决定一个企业(旗下产品)的生存空间、营收等级、是生意or独角兽。第2步:竞争者结构分析第3步:创新升级可能性第4步:供应链条与行业生态苹果并购NEXT就是并购人才,软件系统与硬件设计能力。——乔布斯深刻地理解供应链条与生态位置对于企业的重要性!第5步:进入者分析第6步:替代品威胁行业与市场分析六步法的核心价值帮助我们系统地分析一个行业的商业价值与竞争格局,探寻新机遇与新位置的有效方法。2 竞品分析(.

2021-01-20 20:49:24 205

原创 调用讯飞开放平台的语音转写api

讯飞开放平台提供的api# -*- coding: utf-8 -*-## author: yanmeng2## 非实时转写调用demoimport base64import hashlibimport hmacimport jsonimport osimport timeimport requestslfasr_host = 'http://raasr.xfyun.cn/api'# 请求的接口名api_prepare = '/prepare'api_uplo.

2020-09-11 18:12:28 2933 1

原创 Python发邮件(练习)

#/usr/bin/python# coding=utf-8import numpy as npimport pandas as pdimport smtplibfrom email.mime.text import MIMETextfrom email.mime.multipart import MIMEMultipartfrom email.mime.image import MIMEImagefrom email.header import Headersender = '1980

2020-08-04 18:27:32 184

原创 使用Python发送邮件(中移动139邮箱)

#/usr/bin/python# coding=utf-8import numpy as npimport pandas as pdimport smtplibfrom email.mime.text import MIMETextfrom email.mime.multipart import MIMEMultipartfrom email.mime.image import MIMEImagefrom email.header import Headersender = '1980

2020-07-28 11:44:51 975

原创 feature selection & feature extraction

1、概述——特征选择 & 特征提取特征选择(feature selection)和特征提取(feature extraction)都属于降维(dimension reduction)(同)目的:减少特征数据集中的**属性(或者称为特征)**的数目。(异)方法:特征提取的方法主要是通过属性间的关系,如组合不同的属性得到新的属性,这样就改变了原来的特征空间。特征选择的方法是从原始特征数据集中选择出子集,是一种包含的关系,没有更改原始的特征空间。2、特征提取的主要方法:PCA

2020-05-18 15:22:29 740

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除