自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(68)
  • 收藏
  • 关注

原创 Datawhale 《南瓜书》

想法以西瓜书为主线,目前先内部推开一个demo

2018-12-22 02:46:00 7171 2

原创 机器学习 scikit-learn8 - 预测贷款用户是否会逾期 - Stacking模型融合【调包】

网络搜索 - 目录1 说明2 代码使用方法3 核心代码说明4 问题参考文章1 说明在做逻辑回归的最初就有尝试做网络搜索,找到最佳的特征组合代码链接: https://github.com/spareribs/kaggleSpareribs/blob/master/Overdue/ml/for beginner/stacking.py2 代码使用方法【必须】先执行 features 中的...

2018-11-25 17:58:07 2853 3

原创 sqlzoo 答案全集

sqlzoo官网 SELECT basics 答案 SELECT from world 答案 SELECT from nobel 答案 SELECT in SELECT 答案 SUM and COUNT 答案 JOIN 答案 More JOIN 答案 Using NULL 答案 Self JOIN 答案 ...

2018-10-12 13:00:21 42731 3

原创 4 SELECT within SELECT 子查询

目录硬间隔表示及求解 [选学]软间隔表示及求解 [选学]线性支持向量机分类实现可以看出,不同的分割线所对应的间隔大小是不一致的,而支持向量机的目标是找到最大的分类硬间隔所对应的分割线。硬间隔表示及求解 [选学]我们已经知道支持向量机是根据最大间隔来划分,下面考虑如何求得一个几何间隔最大的分割线。对于线性可分数据而言,几何间隔最大的分离超平面是唯一的,这里的间隔也被我们称之为「硬间隔」,而...

2020-03-13 02:58:43 5446 3

原创 sqlzoo - 1 SELECT names 文字样式匹配查询

参数默认值说明hidden_layer_sizes例如hidden_layer_sizes=(50, 50),表示有两层隐藏层,第一层隐藏层有50个神经元,第二层也有50个神经元activationrelu激活函数,{‘identity’, ‘logistic’, ‘tanh’, ‘relu’} - identity:f(x) = x- logistic:其实...

2020-03-13 02:22:34 7315 8

原创 题1:查询" 01 "课程比" 02 "课程成绩高的学生的信息及课程分数

题目查询" 01 “课程比” 02 "课程成绩高的学生的信息及课程分数查询同时存在" 01 “课程和” 02 "课程的情况查询存在" 01 “课程但可能不存在” 02 "课程的情况(不存在时显示为 null )查询不存在" 01 “课程但存在” 02 "课程的情况解释...

2019-05-17 11:30:20 34353 2

原创 Mysql 刷题记(经典42题)

文章目录数据表ER图如下表结构创建测试数据学生表 Student科目表 Course教师表 Teacher成绩表 SC我使用的Mysql版本是5.7.19。答案可能会因版本会有少许出入。数据表ER图如下表结构学生表:Student(SId,Sname,Sage,Ssex)SId 学生编号Sname 学生姓名Sage 出生年月Ssex 学生性别课程表:Course(...

2019-05-17 10:40:00 468

原创 李宏毅机器学习入门学习笔记(六) Brief Introduction of Deep Learning

deep learning的趋势:Google使用deep learning回顾一下deep learning的历史:deep learning的发展perceptron非常像我们的logistics regression只不过是没有sigmoid部分。09年的GPU的发展是很关键的,节省了很多的时间。我们都知道机器学习有三个step,那么对于deep learning呢?ste...

2019-04-02 21:05:11 506

原创 爬虫日记 sandvik

文章目录查看所有刀具展开搜索产品数据分析原始数据字段分析技术难点查看所有刀具请求分析 https://www.sandvik.coromant.com/zh-cn/_vti_bin/tibp/coromant/search.svc/getgroupedleaves包含3个层级的信息展开搜索请求分析 https://www.sandvik.coromant.com/zh-cn/_v...

2019-03-12 01:21:02 547

原创 李宏毅机器学习入门学习笔记(五) Classification:Logistic Regression

文章目录Step1 逻辑回归的函数集Step2 定义损失函数Step3 寻找最好的function为什么不学线性回归用平方误差?Discriminative(判别)v.s. Generative(生成)一个好玩的例子判别(Discriminative)方法不一定比生成(Generative)方法好Multi-class Classification(多类别分类)Softmax为什么Softmax的...

2019-03-08 18:52:53 532

原创 李宏毅机器学习入门学习笔记(四) Classification:Probabilistic Generative Model

文章目录Classification 分类又是神奇宝贝举例分类神奇宝贝如何分类?当作回归问题处理?Ideal Alternatives(理想替代品)盒子抽球抽球的概率和分类有什么关系?Prior 先验高斯分布应用最大似然估计开始分类修改model三大步为什么是高斯分布?Posterior Probability(后验概率)Classification 分类分类要找一个function,输入就...

2019-03-07 18:12:36 591

原创 Python 知识星球爬虫(二)获取星球评论信息

背景想快速地提取 组队学习 知识星球打卡的信息在原有的基础上进行改良,此处附上链接 Python 知识星球爬虫(一) 根据 topic > comment 爬取数据遇到的难点超过30条评论的数据如何获取user-agent + cookie 绑定登陆 调试代码的时候可以把标星的地方都加上正则表达式匹配评论内容re.match ,现在改成re.findall时间url编码问...

2019-02-25 15:38:45 2691 2

原创 李宏毅机器学习入门学习笔记(三)Gradient Descent

文章目录什么是Gradient Descent(梯度下降法)?Review: 梯度下降法Tip1:调整 learning rates(学习速率)小心翼翼地调整 learning rate自适应 learning rateAdagrad 算法Adagrad 是什么?Adagrad举例Adagrad 存在的矛盾?多参数下结论不一定成立Adagrad 进一步的解释Tip2:Stochastic Grad...

2019-02-19 19:48:50 785

原创 李宏毅机器学习入门学习笔记(二)Where does the error come from

课程介绍上节课《李宏毅·机器学习》读书笔记(一)Regression - Case Study,主要介绍了回归算法的整个演算过程。在课程最后为了改善模型,不断提升模型的复杂度,但是效果反而变差了。本节课主要介绍其他改善模型的方法,并介绍交叉验证这种模型选择的方案。Error的来源从上节课测试集数据来看,Average ErrorAverage\ ErrorAverage&am

2019-02-19 13:10:29 263

原创 李宏毅机器学习入门学习笔记(一)Regression - Case Study

文章目录定义应用举例建模详细步骤模型假设(Model)(Goodness of function)定义Regression 就是找到一个函数 functionfunctionfunction ,通过输入变量 xxx,输出一个数值 ScalarScalarScalar。应用举例股市预测(Stock market forecast)输入:过去10年股票的变动、新闻咨询、公司并购咨询等...

2019-02-18 12:24:40 1255 1

转载 CSDN的创建及使用

本文转自 Datawhale 推文 CSDN的创建及使用文章目录一、创建CSDN博客详细流程1. 注册2. 绑定手机二、编辑和发布博客1.设置markdown格式2. 发布文章3.常见的markdown语法一、创建CSDN博客详细流程1. 注册首先进入CSDN博客首页 https://blog.csdn.net/【1.注册】⇒\Rightarrow⇒ 【2.微信扫码】⇒\Righta...

2019-02-16 10:45:38 288

转载 CSDN - markdown语法

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...

2019-02-16 09:06:45 202

原创 阿里云 ECS服务器 部署 MySql服务

文章目录环境详细操作步骤1 确保服务器系统处于最新状态2 重启服务器3 确认是否已经安装 mysql4 下载MySql安装包5 安装 MySql6 设置开机启动Mysql7 启动Mysql服务8 设置root密码9 开启远程登录,授权root远程登录环境[root@iZayh3eg8rjhsjZ ~]# lsb_release -aLSB Version: :core-4.1-amd6...

2019-01-31 18:06:52 285 1

原创 Python面向过程思想 - 给小白入门的一些讲解

文章目录背景题目题目分析代码详解读取文件,key值为学习项目,value值为一个负责人列表open() 方法f 变量答案代码读取文件判断是否重复,使用列表判断判断是否重复,使用字典判断总结背景学习Python 变量 字典 列表 字符串 这些基础之后,入门第一个小的作业。那我该怎么入门呢?我该怎么去学习呢?题目读取一个文件,将文件中转换为字典,key值为学习项目,value值为一个负责人列...

2019-01-29 11:25:36 575

转载 林轩田机器学习基石 - 学习笔记4 - 机器学习的可行性

上节课,我们主要介绍了根据不同的设定,机器学习可以分为不同的类型。其中,监督式学习中的二元分类和回归分析是最常见的也是最重要的机器学习问题。本节课,我们将介绍机器学习的可行性,讨论问题是否可以使用机器学习来解决。一、Learning is Impossible首先,考虑这样一个例子,如下图所示,有3个label为-1的九宫格和3个label为+1的九宫格。根据这6个样本,提取相应label下的...

2019-01-27 22:42:23 180

原创 林轩田机器学习基石 - 练习1 - PLA算法 & Pocket PLA算法

文章目录详细代码文件加载PLA算法 和 Pocket PLA算法调用实例 todo本文主要是针对 练习1 的注释详细代码文件加载import numpy as npdef loadfile(file): X = [] # features, shape = (samples, features) Y = [] # labels, shape = (sample,) ...

2019-01-23 20:36:58 619

原创 selenium使用 动态页面分析

test

2019-01-21 23:27:16 351

原创 wxpy微信机器人学习2 -获取群人员信息

#!/usr/bin/env python# -*- coding: utf-8 -*-"""# @Time : 2019/1/10 15:07# @Author : Spareribs# @File : 04_listen_group.py# @Software : PyCharm# @Description : """from w..

2019-01-17 21:00:50 2082 1

原创 Jmeter wrk ab压测软件对比

test

2019-01-16 23:40:51 1139

原创 wxpy微信机器人学习1 - 群回复@内容

文章目录参考文档一个简单的示例参考文档说明文档Github链接从零开始微信机器人(一):wxpy简介(登录、消息发送、注册回复)从零开始微信机器人(二):使用图灵机器人和api.ai相关接口从零开始微信机器人(三):表情机器人的制作一个简单的示例#!/usr/bin/env python# -*- coding: utf-8 -*-"""# @Time : 20...

2019-01-14 23:39:13 826

转载 林轩田机器学习基石课程笔记3 - 机器学习类型

上节课我们主要介绍了解决线性分类问题的一个简单的方法:PLA。PLA能够在平面中选择一条直线将样本数据完全正确分类。而对于线性不可分的情况,可以使用Pocket Algorithm来处理。本节课将主要介绍一下机器学习有哪些种类,并进行归纳。一、Learning with Different Output Space Y我们在上节课引入的银行根据用户个人情况判断是否给他发信用卡的例子,这是一个典...

2019-01-12 16:31:21 126

转载 林轩田机器学习基石课程笔记2 - 学习回答Yes/No

上节课,我们主要简述了机器学习的定义及其重要性,并用流程图的形式介绍了机器学习的整个过程:根据模型H,使用演算法A,在训练样本D上进行训练,得到最好的h,其对应的g就是我们最后需要的机器学习的模型函数,一般g接近于目标函数f。本节课将继续深入探讨机器学习问题,介绍感知机Perceptron模型,并推导课程的第一个机器学习算法:Perceptron Learning Algorithm(PLA)。...

2019-01-12 16:28:01 198

原创 《南瓜书》 chapter4

4.1熵是度量样本集合纯度最常用的一种指标,代表一个系统中蕴含多少信息量,信息量越大表明一个系统不确定性就越大,就存在越多的可能性。假定当前样本集合 DDD 中第 kkk 类样本所占的比例为 pk(k=1,2,...,∣y∣)p_k(k =1,2,...,|y|)pk​(k=1,2,...,∣y∣) ,则 DDD 的信息熵为:(4.1)Ent(D)=−∑k=1∣y∣pklog2pkEnt(...

2019-01-10 23:57:34 522

转载 林轩田机器学习基石课程笔记1 -The Learing Problem

最近在看NTU林轩田的《机器学习基石》课程,个人感觉讲的非常好。整个基石课程分成四个部分:When Can Machine Learn?Why Can Machine Learn?How Can Machine Learn?How Can Machine Learn Better?每个部分由四节课组成,总共有16节课。那么,从这篇开始,我们将连续对这门课做课程笔记,共...

2019-01-08 20:51:41 307

原创 机器学习基石作业 PLA算法 & Pocket PLA算法

作业1:PLA算法首先,我们使用人工数据集来研究PLA。数据集在 https://www.csie.ntu.edu.tw /~htlin/course/ml15fall/hw1/hw1_15_train.dat数据集的每一行包含一个(x n,y n),其中xn∈R4。该行的前4个数字包含x n有序的分量,最后一个数字是y n。请使用w = 0初始化算法,并将sign(0)设为-1。...

2019-01-06 16:42:38 1157

原创 机器学习算法 - 时间序列系3 - Python主要时序模式算法列表

文章目录参考文章Python主要时序模式算法列表acf()方法详解plt_acf()方法详解pacf()方法详解plot_acf()方法详解adfuller()方法详解diff()方法详解ARIMA()方法详解summary() & summaty2()方法详解aic/bic/hqic 方法详解froecast()方法详解acorr_ljungbox()方法详解算法实践分析参考文章ht...

2018-12-19 21:59:54 1109

原创 机器学习算法 - 时间序列系2 - 时序模式实战

直接贴一波代码,详细后面再分析#!/usr/bin/env python3# -*- coding: utf-8 -*-# pylint: disable=E1101"""Create

2018-12-18 23:21:35 676

原创 机器学习算法 - 时间序列系1 -时序模式概念

时序模式1 时间序列算法2 时间序列的预处理2.1 平稳性检验2.2 纯随机性检验3 平稳时间序列分析3.1 AR模型3.2 MA模型3.3 ARMA模型3.4 平稳时间序列模型4非平稳时间序列分析4.1 差分运算4.2 ARIMA模型5 Python主要事需模式算法1 时间序列算法2 时间序列的预处理首先要对观察值序列做纯随机性和平稳性进行校验,称为序列的预处理。对于纯随机序列(白噪声...

2018-12-17 23:19:18 1250

原创 机器学习 模型评估中的 精确率、召回率、F1、ROC、AUC

文章目录1 混淆矩阵1.2 多分类的例子2.2 二分类的例子二分类真实数值计算:1 混淆矩阵准确率对于分类器的性能分析来说,并不是一个很好地衡量指标,因为如果数据集不平衡(每一类的数据样本数量相差太大),很可能会出现误导性的结果。例如,如果在一个数据集中有95只猫,但是只有5条狗,那么某些分类器很可能偏向于将所有的样本预测成猫。整体准确率为95%,但是实际上该分类器对猫的识别率是100%,而对...

2018-12-14 23:58:59 1154

原创 SQLAlchemy 操作数据库

参考文档 https://www.ctolib.com/topics-96759.html文章目录1 简介1.1 对象关系映射 ORM1.2 版本检查2 简单操作实例数据库 增删查改seesion内的高级操作3 详细操作解释connecting(连接数据库)声明映射关系 Declare a Mapping创建表元数据信息 Create a Schema查询元数据表信息执行命令创建数据表元数据定义...

2018-12-12 19:05:21 6909 1

原创 Datawhale 算法实战第1期 Task 1.1

文章目录文档记录002003代码解释x与y的处理模型参数模型存储文档记录编号文档002报告 http://t.cn/Eye5LH2 代码: http://t.cn/Eye5Atx003http://t.cn/EyFC6md004http://t.cn/EyFjDqB005http://t.cn/EyFYzJi006007008...

2018-12-10 13:13:05 235

原创 Leetcode 23. 合并K个排序链表

文章目录题目: 最大子序和答案方案1:遍历法【思路】【实现】【分析】方案2【思路】【实现】【分析】方案3【思路】【实现】【分析】问题题目: 最大子序和给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。示例:输入: [-2,1,-3,4,-1,2,1,-5,4],输出: 6解释: 连续子数组 [4,-1,2,1] 的和最大,为 6。...

2018-12-03 23:18:32 144

原创 38. 报数 Count and Say

文章目录题目:报数 Count and Say参考答案题目:报数 Count and Say报数序列是一个整数序列,按照其中的整数的顺序进行报数,得到下一个数。其前五项如下:1112112111112211 被读作 “one 1” (“一个一”) , 即 11。11 被读作 “two 1s” (“两个一”), 即 21。21 被读作 “on...

2018-12-02 00:48:32 108

原创 35. 搜索插入位置 Search Insert Position

文章目录题目:搜索插入位置 Search Insert Position参考答案题目:搜索插入位置 Search Insert Position参考答案class Solution: def searchInsert(self, nums, target): """ :type nums: List[int] :type target:...

2018-12-02 00:35:50 220

原创 28. 实现 strStr() Implement strStr()

文章目录题目:28.实现 strStr() Implement strStr()参考答案题目:28.实现 strStr() Implement strStr()实现 strStr() 函数。给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回 -1。示例 1:输入: h...

2018-12-02 00:19:58 176

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除