自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 问答 (4)
  • 收藏
  • 关注

原创 生产系统中的机器学习笔记(三):误差分析与性能审计

误差分析与性能审计在机器学习系统的生命周期中,模型这一阶段被分为了两个部分,分别是上一节的选择、训练模型,与这一节的误差分析与性能审计。选择、训练模型一节中,提出了以数据为中心的AI开发,强调对于构建一个将被应用于生产系统中的模型来说,我们不必在模型的算法实现上花费过多的精力,而更应关注数据的质量,使用高质量的数据来训练出适合具体应用环境的模型,并建立模型的评价基线。误差分析与性能审计这一节则围绕对模型的评价展开。错误分析在上一节中讲到,模型训练完成后,即使取得了很低的平均训练误差,此时的模型也

2022-05-04 11:21:38 332

原创 生产系统中的机器学习笔记(二):选择、训练一个模型

这是我在学习DeepLearningAI上吴恩达老师的《生产系统中的机器学习》课程过程中的笔记。这一系列课程的质量很高,学习中受益匪浅。老师的讲授顺序是从模型部署至模型训练再到数据处理,模型部署部分的笔记忘记保存了,明天再整理,这一篇是模型中的选择和训练模型部分。选择、训练一个模型在模型选择与训练过程中,很多人往往会更倾向于不断优化模型的设计、参数的选择,这称为以模型为中心的人工智能开发(Model-centric AI development)。但是事实上,经过这些年机器学习或者说深度学习的高速发

2022-05-01 12:27:13 1064

原创 生产系统中的机器学习:实验笔记(一)——模型部署

这是吴恩达老师在DeepLearningAI上的课程,《生产系统中的机器学习》第一个不记分实验的学习记录。这学期有老师推荐了这门课,听了一下果断付费了,因为现在比较权威的、跟生产联系紧密的机器学习或者是深度学习的课程并不多,这一系列课的质量很高,听下来收获也很多。为了push自己保持学习,我会把所有实验过程都总结记录,第一个是关于模型部署。不计分实验Part01 - 部署一个机器学习模型部署预先训练好的计算机视觉模型YOLO v3。步骤如下:检查用于目标检测的图片数据集;看一看模型本身;使用fa

2022-04-30 21:44:54 3138

原创 MySQL笔记(六)——事务及其ACID特性

InnoDB的逻辑存储结构支持事务与行级锁定,是InnoDB区别于MyISAM的两大特点。关于事务,需要了解的相关知识很多,涉及到redo日志和undo日志、MySQL自动恢复机制、锁和隔离级别等,各方面的点又相互联系。以前没有深入地去理解过,这一次写这篇笔记,翻了两本书和很多的文章,希望能巩固一下。在学习事务之前,还是需要再了解一下InnoDB的逻辑存储结构。InnoDB逻辑存储结构...

2020-02-17 17:12:39 374

原创 MySQL笔记(五)——存储过程和函数、触发器

存储过程和函数概览存储过程和函数是事先编译并存储在数据库中的一段SQL语句的集合。5.0版本开始支持。存储过程:无返回值,参数可使用IN、OUT和INOUT类型;函数:必须有返回值,参数只能是IN类型。优点1、存储过程和函数可重复使用,调用存储过程和函数可简化开发人员的工作量;2、调用存储过程和函数只需要传递存储过程/函数名称和参数即可,能够减少数据在数据库和应用服务器...

2020-02-12 15:55:52 668

原创 MySQL笔记(四)——视图

视图视图是一种虚拟存在的表,并不在数据库中实际存在,它的列和数据行都是对原查询中使用的表的列和数据行的映射。由于视图是虚拟的表,它并没有存放任何数据,只有在使用视图时,才会从原表中动态地生成数据。对于用户来说,视图真实使用的表基本上是透明的。视图操作视图的操作主要是创建、修改、更新、删除和查询,语句都和表的操作类似。笔记中以MySQL官方的demo库sakila来做练习。创建创建视图的用...

2020-02-09 09:17:31 440

原创 MySQL笔记(三)——索引与优化相关

概述例子:模拟100个用户同时对一个拥有100万行数据的表进行2000次查询,对比无索引和有索引的耗时情况。mysqlslap --defaults-file=/etc/my.cnf --concurrency=100 --iterations=1 --create-schema='test' --query="select * from test.t100w where k2='MN89...

2020-02-07 01:02:26 423

原创 MySQL笔记(二)——SQL基础

总览SQL语句主要分为三大类,分别是:DDL(数据定义语言):用于定义数据库、表、列、索引等数据库对象,常用语句关键字为create、drop、alter。DML(数据操纵语言):用于添加、删除、更新和查询数据库记录,常用语句关键字为insert、delete、update和select等。DCL(数据控制语言):用于定义数据库、表、列和用户的访问权限,常用语句关键字是grant和revo...

2020-02-04 17:17:14 1688

原创 MySQL笔记(一)——安装、配置、启停与MySQL体系结构

安装按下面的步骤,一步步来安装配置,肯定不会出错。先在官网下载MySQL二进制包,我练习用的版本是5.7,还有台机器装的8.0,用来了解一些新的特性。下载好二进制包后,将其解压到/application/mysql目录下,即为MySQL的安装目录basedir。接着配置一下环境变量,在/etc/profile末尾添加一句:export PATH=/application/mys...

2020-02-04 15:04:53 441

原创 聊聊Java面试(一)——从内部类说起

引言这段时间公司一直在招人,也做了几场面试,发现很多即使有着多年开发经验的老手却也会在被他们标记为精通的语言这一关栽跟头。面试中对编程语言的考察可以说是最为基础的一部分,对于工作年限较短甚至是刚毕业的面试者,我往往会把考察的重点放在这方面,而对于经验相对成熟的面试者,这部分的考察会是个开场热身,答得好第一印象就好,如果连这都答不好,后面的天也就比较难聊了。这几场给别人的面试下来,我突然想把一些J...

2019-02-22 18:25:16 390

原创 Spark学习笔记(一):关于RDD

RDD基础RDD(Resilient Distributed Dataset),即弹性分布式数据集。它是分布在多个计算机节点上、可并行操作的元素集合,是Spark主要的编程抽象。RDD是不可变的分布式对象集合,每个RDD都被分为多个分区、可以运行在集群中不同的节点上。它是Spark对数据的核心抽象,Spark中对数据的操作,不外乎就是创建RDD、转化已有的RDD以及调用RDD操作进行求...

2018-12-20 11:55:27 561

原创 算法学习之路(一)——数据抽象

前言本文根据Algorithms(《算法》)一书,介绍算法的基础知识,围绕数据抽象,介绍了包括背包、队列和栈三种集合类数据类型的定义以及代码实现,最后讲解了链表的相关定义以及使用链表实现集合类数据类型。准备工作在开始聊数据抽象之前,我们需要先弄清楚几个概念,都是很基础的东西,不过话说回来,算法本就该是编程的基础,这些基础的概念是我们开始学习算法的前提:1、什么是数据类型?2、什...

2018-09-11 01:01:27 3284 2

原创 Python数据分析入门(二)——从NumPy数组说起

前言第一篇中说好了这个系列要勤更,但是这一篇还是拖得有点久,毕竟是工作之余的学习,各种事情都在耽误吧。上一篇有说到《Python从入门到实战》这本书,这段时间我已经读完了,里面更多的是Python的一些使用基础,如果这一主题的文章继续围绕这本书就不太合适了,我自己也想加快一下学习的速度,做一些更有价值的总结,所以从这一篇开始主要是围绕《利用Python进行数据分析(第二版)》这本书的笔记总结。...

2018-08-20 00:51:36 5537 5

原创 Python数据分析入门(一)——初探数据可视化

前言静下心算算,当程序员已经有好几年了,不过自大学时代开始,学习对我来说就是个被动接受的过程,学校的课程、当时热门的移动端开发、数据库的学习、web学习、PHP后端学习……需要做什么我便去学什么,到了今天,突然意识到我是不是该给自己一个明确的发展方向了,毕竟岁月不饶人,96年的小朋友都参加工作了,不精通某一领域始终都会觉得浑浑噩噩。因为对大数据比较感兴趣,而这方面的知识挖掘空间和发展空间都很大...

2018-08-10 17:38:19 75718 3

原创 设计模式笔记(1)——从Gson看工厂模式

前言“设计模式”这四个字,对于使用面向对象语言进行软件开发的程序员来说绝不会陌生,不过对于很多经验尚浅的而言也仅仅是知道而已,如果仅仅是一股脑地在需求与编码中忙碌,很可能都说不出几种设计模式,更别谈在实际的开发中使用了。学习设计模式可以说是开发者的晋级之路,熟练掌握设计模式能很大程度地提升开发者的设计思想和封装思想,加深对面向对象设计的理解、提高编码效率与质量。最近有了个写写与设计模式相关的博客的...

2018-06-23 02:06:11 887

原创 Kotlin学习笔记——内部类和嵌套类

Kotlin学习笔记——内部类和嵌套类内部类和嵌套类 最近在学习Kotlin语言,也在尝试着写一些使用Kotlin的demo,有些无奈的是目前相关的中文资料少之又少,很多资料都是机翻的,看得人头大,连实体书《Kotlin实战》的翻译都有些让人难受,写得很绕,内部类嵌套类这两页看得我直想睡觉。。这里就简单地总结一下这两个很基础的点。

2017-09-06 15:20:11 6962

Algorithms书中使用的库algs4.jar

Algorithms(即《算法》)一书中使用的库的jar包,包括示例代码中引用到的一些静态方法。

2018-09-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除