自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

我是码农-资源共享博客

  • 博客(996)
  • 资源 (33)
  • 收藏
  • 关注

原创 WEB技术视频教程大全

01、Javaav4710378102、Springav4710378103、Spring Mvcav4717683204、MyBatisav4722883005、Hibernateav4738248206、Spring Bootav4723013707、Spring Cloudav4722883008、Dubboav4700914309、MySQLav4770290510、...

2019-06-25 15:27:54 741

原创 找出数组中有3个出现一次的数字

题目:一个int数组中有三个数字a、b、c只出现一次,其他数字都出现了两次。请找出三个只出现一次的数字。下面要来看下如果找出这个与另外两个数的该bit位不同的数。先看第一种情况,如果a,b,c三个数中,有两个该bit位为0,另一个为1,我们遍历数组,分别统计该数组元素中该bit位为1和0的元素个数,分别设为count1和count0,并同时将所有该bit位为1的元素异或,所有该bit位为0的元...

2019-06-04 18:22:24 983

原创 挑战与破解之道

笔者曾在一个比特币的QQ群里担任管理员,群里大部分是刚入 门的比特币者,对于比特币的原理一知半解,连中本聪的论文译本都没完整读过。这些人却往往一出手就买上几十上百个比特币,即使按照当时的价格,也相当于人 民币几万到几十万元。他们无一例外的对于比特币的未来充满了信心。在比特币的官方论坛上有各种不同的观点、意见,其中对比特币持长期悲观态度的人不在少数。一般来说,知道这个论坛且在上面发言的网友对比特...

2019-05-08 09:55:24 1073

原创 HDFS加密区加密过程

HDFS加密区(encryption zone)中的每个文件都使用唯一的数据加密密钥(data encryption key, DEK)进行加密,明文DEK被区域级加密密钥:加密区密钥(encryption zone key, EZK)加密成加密的数据加密密钥(encrypted DEK, EDEK)。DEK不被永久保存,EDEK作为指定文件NameNode元数据中的扩展属性永久保存。KMS:...

2019-05-08 09:52:47 965

原创 人工智能-机器学习-深度学习-电子书大全

MATLAB函数速查手册(修订版)-邓薇, R的极客理想——工具篇 (数据分析技术丛书)-张丹 著, R语言与网站分析 (数据分析技术丛书)-李明著, R语言实战 (图灵程序设计丛书)-Robert I. Kabacoff, R语言数据分析与挖掘实战 (大数据技术丛书)-张良均 等著, 《智能时代》-吴军, 与机器赛跑-东西文库, 人工智能-[美]卢克·多梅尔, 人工智能时代 (湛庐文化机器人与人...

2019-05-08 09:51:34 504

原创 《区块链:从数字货币到信用社会》电子书下载 -(百度网盘 高清版PDF格式)

区块链:从数字货币到信用社会-长铗 韩锋等在线阅读百度网盘下载录序一 区块链:建设互联网的价值高速公路序二 区块链:网络世界运行规则与技术的全新探索序三 区块链——未来全球信用的基础协议第一章 区块链创世纪第二章 区块链基础第三章 区块链进阶第四章 智能合约第五章 区块链怎么玩...

2019-05-08 09:51:00 9066

原创 RFID 复杂事件检测算法-毕业论文

摘 要本论文首先介绍了RFID技术的概念、工作原理、发展过程、应用背景等信息,然后对本系统所需的硬件条件,即RFID阅读器的特性和配置等信息进行说明,接下来介绍了基于RFID的仓储管理系统的开发背景,探讨了数据库的功能特点,做出了系统需求分析,并在完成数据库设计的基础上进行程序开发以及系统的运行,本系统主要完成对仓库的库存管理,包括货品入库,货品存库,货品出库等几个方面,并通过各个表单的操作来...

2019-05-08 09:50:40 468

原创 第3章 RFID的仓储管理系统实现关键技术

3.1.Alien RFID系统3.1.1. Alien RFID系统组成1)Alien ALR-9900 阅读器Alien ALR-9900 阅读器用于读取和处理任何EPC标签,然后将事件信息报告给主机系统。主机可以在本地通过RS-232连接到阅读器或者在远程通过网络连接。Alien ALR-9900阅读器具有高性能、操作简单、易于管理、抗干扰能力强等一系列优点。...

2019-05-08 09:50:24 704

原创 第4章 基于RFID的仓储管理系统的实现

4.1.需求分析目前,在国内外应用比较广泛的仓储管理系统都采用了条形码或RFID,与条形码识别系统相比,无线射频识别技术具有很多优势,因此研究最多的还是射频识别技术在仓储中的应用,RFID技术的应用可以改善目前仓库管理的现状的不足。根据对实际仓储管理流程的分析,基于RFID的仓储管系统应满足以下几个方面的需求:1)实现管理系统应用的基本功能,例如用户权限管理、数据查询、统计管理等。...

2019-05-08 09:50:10 9837

原创 数据结构精品电子书分享之《数据结构》算法实现及解析

书籍简介作者:高一凡副书名:配合严蔚敏、吴伟民编著的《数据结构》(C语言版)出版日期:2002-10-1出版社:其它页数:450ISBN:7-5606-1176-1/TP*0608文件格式:PDF文件大小:8.33 MB《数据结构》算法实现及解析是信息与计算科学专业中一门重要的专业基础课程。当用计算机来解决实际问题时,就要涉及到数据的表示及数...

2019-05-07 17:55:13 1008

原创 怎样判断两个链表相交并找到第一个相交点(微软数据结构面试题)

1、给出两个单向链表的头指针pHead1和pHead2,判断这两个链表是否相交。假设两个链表均不带环。如果两个链表相交于某一节点,那么在这个相交节点之后的所有节点都是两个链表所共有的。也就是说,如果两个链表相交,那么最后一个节点肯定是共有的。先遍历第一个链表,记住最后一个节点,然后遍历第二个链表,到最后一个节点时和第一个链表的最后一个节点做比较,如果相同,则相交,否则不相交。时间复杂度为O...

2019-05-07 17:55:02 321

原创 信用机制的发展与区块链的诞生

一个人能记住多少张脸?数学家邓巴在研究中发现,人与人之间点对点的信任,150人已经是极限,这得到科学界广泛的认 同,这个数也被称为“邓巴数”。因此,过去的信任机制一直都是“中心化”的,需要一个中间机构来做信用背书。这不仅影响了效率,增加了成本,还存在中心 “大到不能倒”、中心故障会导致系统整体瘫痪等缺陷。区块链的出现,可以在任意两个人之间建立点对点的信任,不需要中心机构的参与,甚至不需要监督。...

2019-05-07 17:42:30 760

原创 基于RFID的仓储管理系统的设计与实现-毕业论文

摘 要无线射频识别(Radio Frequency Identification,RFID)技术是一种非接触式的自动识别技术,与早期的自动识别技术相比,RFID技术因其特有的非接触性以及对多个目标同时识别的特性,正逐渐被广泛地应用在物流、交通和防伪等多个领域。传统的仓储管理,一般依赖于一个非自动化的,以纸质文件为基础的系统来记录和跟踪进出的货物。这种人工操作方式会导致仓储管理效率低...

2019-05-07 17:39:54 8961 1

原创 区块链是什么?

人工智能时代,一本书读懂区块链金融 (互联网_时代企业管理实战系列)-马兆林, 区块链2.0-谭磊, 区块链原理、设计与应用 (区块链技术丛书)-杨保华 & 陈昌, 区块链将如何重新定义世界-唐文剑, 区块链技术指南-邹均, 区块链社会:解码区块链全球应用与投资案例-龚鸣, 区块链革命:比特币底层技术如何改变货币、商业和世界-[加]唐塔普斯科特 & [加]亚力克斯·塔普斯科特, 区...

2019-05-07 17:38:37 574

原创 领域知识库构建及信息检索系统

系统源码及原文免费下载地址请访问:www.54manong.com一、系统简介通过对网络爬虫工具的设置并扩展,自动抓取行业领域资料,或通过语料管理模块上传领域相关资料,形成语料库。调用信息抽取模块和信息去噪模块,提取语料库中pdf、doc、ppt、html、excel、txt及专利等文件中的内容信息,并将抽取的信息进行去噪处理,去除标签、乱码、页眉和页脚等无用信息,同时确保有用信息被完整...

2019-05-07 17:38:13 3512

原创 第四章 基于RFID的仓储管理系统的实现

4.1.基于RFID的仓储管理系统的需求分析传统的仓储管理,一般依赖于一个非自动化的,以纸质文件为基础的系统与人工记忆相结合来实现库存管理。这种方式不仅费时费力,而且容易出错,使得货物仓储环节效率低下,给企业带来不可估量的损失。为了弥补传统仓储管理系统的缺点,我们设计基于RFID的仓储管理系统。根据对实际仓储管理流程的分析,基于RFID的仓储管系统应满足以下几个方面的需求:(1)具有...

2019-04-28 10:06:22 992

原创 Redis入门指南 - 电子书下载 -(百度网盘 高清版PDF格式)

Redis入门指南-李子骅在线阅读百度网盘下载(4lcx)书名:Redis入门指南作者:李子骅格式:EPUB, HTMLZ, PDF路径:点击打开排序作者:李子骅排序书名:Redis入门指南日期:08 12月 2018uuid:dae2a426-1c90-412a-bb96-08b3f4e522e...

2019-04-28 10:05:44 6126

原创 第1章 前 言

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=12581.1.问题的背景1.1.1.RFID技术RFID即无线射频识别技术(Radio Frequency Identification),俗称电子标签,是一种新型的非接触式自动识别技术,它利用射频信号及空间的耦合电感或者电磁耦合的传输特性,自动实现对物体进行识别的功能,识别...

2019-04-28 10:05:13 756

原创 爆发:大数据时代预见未来的新思维 (湛庐文化•财富汇) - 电子书下载 -(百度网盘 高清版PDF格式)...

爆发:大数据时代预见未来的新思维 (湛庐文化•财富汇)-艾伯特-拉斯洛•巴拉巴西 (Albert-László Barabási)在线阅读百度网盘下载(9jvg)书名:爆发:大数据时代预见未来的新思维 (湛庐文化•财富汇)作者:艾伯特-拉斯洛•巴拉巴西 (Albert-László Barabási)格式:EPUB,...

2019-04-26 17:32:57 1782

原创 第2章 RFID相关理论介绍

更多免费论文及视频教程资源请访问:我是码农本文链接:http://www.54manong.com/?id=1257免费下载RFID相关毕业论文、RFID相关代码、RFID相关教程请访问:www.54manong.com2.1.RFID技术概述RFID(Radio Frequency Identification)技术即无线射频识别技术,是20世纪90年代开始兴起的一种非接...

2019-04-26 17:32:35 6012 2

原创 kafka入门案例

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1228Conumer_demo1.java内容如下:packagecom.lenovo.kafka_demo;importorg.apache.kafka.clients.consumer.ConsumerConfig;importorg.apache.kafka.c...

2019-03-21 17:37:26 151

原创 程序员面试题-跳台阶问题

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1229题目描述:一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法(先后次序不同算不同的结果)。题目解析:比如只有一个台阶,这个时候这只青蛙没有第二种选择,只能一次跳1级台阶,也就是只有一种跳法。比如共有2个台阶呢?此时,这只青蛙就...

2019-03-21 17:36:25 168

原创 程序员面试题-变态跳台阶问题

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1230题目描述一只青蛙一次可以跳上1级台阶,也可以跳上2级……它也可以跳上n级。求该青蛙跳上一个n级的台阶总共有多少种跳法。关于本题,前提是n个台阶会有一次n阶的跳法。分析如下:f(1) = 1f(2) = f(2-1) + f(2-2) //f(2-2...

2019-03-21 17:35:31 194

原创 二进制中1的个数

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1231题目描述输入一个整数,输出该数二进制表示中1的个数。其中负数用补码表示。时间限制:1秒空间限制:32768K直接上代码吧:intNumberOf1(intn){inti;intnum=0;...

2019-03-21 17:34:34 159

原创 斐波那契数列-编程求解方法大全

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1232题目描述大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项(从0开始,第0项为0)。n<=39直接上我的代码:intFibonacci(intn){intsum=0,l=0,r=1;i...

2019-03-21 17:33:32 7038

原创 把二叉树打印成多行

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1233题目描述从上到下按层打印二叉树,同一层结点从左至右输出。每一层输出一行。voidBinaryTreeLevelOrder(BTNode*root){Queueq;//树为空,直接返回if(root==NULL)...

2019-03-21 17:32:38 131

原创 从尾到头打印链表

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1234题目描述输入一个链表,按链表值从尾到头的顺序返回一个ArrayList。有三种思路,第一就是利用栈先入后出的特性完成,第二就是存下来然后进行数组翻转。第三是利用递归。栈思路:classSolution{public:vector<...

2019-03-21 17:31:42 129

原创 滑动窗口的最大值

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1235题目描述给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值。例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6,6,6,5}; 针对数组{2,3,4,2,6,2,5,1}的滑动窗口有以下6...

2019-03-21 17:30:37 141

原创 快速排序基本思想及代码实现-史上最通俗易懂的

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=12361、算法思想  快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。(1) 分治法的基本思想  分治法的基本思想是:将原问题分解为若干个规模更小但结构与...

2019-03-21 17:29:31 290

原创 不用加减乘除做加法

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=1237题目描述写一个函数,求两个整数之和,要求在函数体内不得使用+、-、*、/四则运算符号。这道题看起来非常有趣,既然做加法,但却不让使用+、-、*、/四则运算符号,很多同学看了一眼就懵逼了,这可难倒八戒了。我们来分析一下,如果不让用四则运算符合,那显然就是用递归了。为啥呢...

2019-03-21 17:28:24 114

原创 不用加减乘除做加法

题目描述写一个函数,求两个整数之和,要求在函数体内不得使用+、-、*、/四则运算符号。这道题看起来非常有趣,既然做加法,但却不让使用+、-、*、/四则运算符号,很多同学看了一眼就懵逼了,这可难倒八戒了。我们来分析一下,如果不让用四则运算符合,那显然就是用递归了。为啥呢?原因很简单,递归程序里可以不需要运算符合,只要有递归结束条件即可。举个例子,比如2+3=?2用二进制表示是00103用二进制表...

2019-03-20 19:09:45 115

原创 快速排序基本思想及代码实现-史上最通俗易懂的

1、算法思想  快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。(1) 分治法的基本思想  分治法的基本思想是:将原问题分解为若干个规模更小但结构与原问题相似的子问题。递归地解这些子问题,然后将这些子问题的解组合为原问题的解。(2)快速排序的基本思想  设当前待排...

2019-03-20 16:17:08 6856

原创 滑动窗口的最大值

题目描述给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值。例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6,6,6,5}; 针对数组{2,3,4,2,6,2,5,1}的滑动窗口有以下6个: {[2,3,4],2,6,2,5,1}, {2,[3,4,2],6,2,5,1}, {2,3,[4,2,6],2,...

2019-03-20 11:10:10 119

原创 从尾到头打印链表

题目描述输入一个链表,按链表值从尾到头的顺序返回一个ArrayList。有三种思路,第一就是利用栈先入后出的特性完成,第二就是存下来然后进行数组翻转。第三是利用递归。栈思路:classSolution{public:vector<int>printListFromTailToHead(ListNode*head){vector<i...

2019-03-19 17:09:24 117

原创 把二叉树打印成多行

题目描述从上到下按层打印二叉树,同一层结点从左至右输出。每一层输出一行。voidBinaryTreeLevelOrder(BTNode*root){Queueq;//树为空,直接返回if(root==NULL){return;}QueueInit(&q);//先将根节...

2019-03-19 12:42:55 130

原创 斐波那契数列-编程求解方法大全

题目描述大家都知道斐波那契数列,现在要求输入一个整数n,请你输出斐波那契数列的第n项(从0开始,第0项为0)。n<=39直接上我的代码:intFibonacci(intn){intsum=0,l=0,r=1;if(n==1)return1;else{...

2019-03-15 10:51:36 552

原创 二进制中1的个数

题目描述输入一个整数,输出该数二进制表示中1的个数。其中负数用补码表示。时间限制:1秒空间限制:32768K直接上代码吧:intNumberOf1(intn){inti;intnum=0;for(i=0;i<32;i++){if((n&(1&l...

2019-03-15 10:20:53 82

原创 程序员面试题-变态跳台阶问题

题目描述一只青蛙一次可以跳上1级台阶,也可以跳上2级……它也可以跳上n级。求该青蛙跳上一个n级的台阶总共有多少种跳法。关于本题,前提是n个台阶会有一次n阶的跳法。分析如下:f(1) = 1f(2) = f(2-1) + f(2-2) //f(2-2) 表示2阶一次跳2阶的次数。f(3) = f(3-1) + f(3-2) + f(3-3)...f(n) = f(n-1) + ...

2019-03-14 11:02:46 197

原创 程序员面试题-跳台阶问题

题目描述:一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法(先后次序不同算不同的结果)。题目解析:比如只有一个台阶,这个时候这只青蛙没有第二种选择,只能一次跳1级台阶,也就是只有一种跳法。比如共有2个台阶呢?此时,这只青蛙就有两种选择了,第一种选择是一次跳1级,跳两次。第二种选择是一次跳2级,跳一次。.......那么共有n级台阶呢,通过大脑想这个过程实...

2019-03-14 10:18:36 99

原创 spark入门小例子

来源:我是码农,转载请保留出处和链接!本文链接:http://www.54manong.com/?id=12211,pyspark2,spark-shellspark网页管理页面:http://127.0.0.1:4040/jobs/3,设置日志输出:log4j.properties.template。把这个日志设置模版文件复制一份到conf/log4j....

2019-03-11 09:53:23 572

ceph_heartbeat分析.docx

ceph_heartbeat分析.docx

2020-01-25

CEPH14.2.4离线安装教程及本地包.zip

ceph_性能调优6_2.pdf

2020-01-25

ceph_性能调优6_2.pdf

ceph_性能调优6_2.pdf

2020-01-25

openstack与ceph整合安装指导文档.docx

openstack与ceph整合安装指导文档.docx

2020-01-25

ceph源码研究入门手册.docx

ceph源码研究入门手册.docx

2020-01-25

红帽分布式存储Ceph介绍.pdf

红帽分布式存储Ceph介绍.pdf

2020-01-25

基于ceph构建PB级对象存储实践-JD金融.pdf

基于ceph构建PB级对象存储实践-JD金融.pdf

2020-01-25

章宇-Ceph存储集群及其在云计算中的应用.pdf

章宇-Ceph存储集群及其在云计算中的应用.pdf

2020-01-25

钟忻—Ceph的PB级存储实践(1).pdf

钟忻—Ceph的PB级存储实践(1).pdf

2020-01-25

Ceph存储中基于温度因子的CRUSH算法改进_穆彦良.pdf

Ceph存储中基于温度因子的CRUSH算法改进_穆彦良.pdf

2020-01-25

Ceph 进程间通信.pptx

ceph MDS集群及负载均衡 架构 CSDN.pdf

2020-01-25

ceph MDS集群及负载均衡 架构 CSDN.pdf

ceph MDS集群及负载均衡 架构 CSDN.pdf

2020-01-25

CentOS6.5源码编译安装和管理Ceph.docx

CentOS6.5源码编译安装和管理Ceph

2020-01-25

Centos6.5安装和管理ceph.docx

Centos6.5安装和管理ceph

2020-01-25

04-SPDK加速Ceph-XSKY Bluestore案例分享-扬子夜-王豪迈.pdf

04-SPDK加速Ceph-XSKY Bluestore案例分享-扬子夜-王豪迈.pdf

2020-01-25

人工智能时代 PDF 电子书

杰瑞·卡普兰教授是人工智能领域不容忽视的未来力量的预言者,作为享誉全球的智能时代领军人,他的洞见对于硅谷乃至世界来说都是不容错过的。在《人工智能时代》这本书中,卡普兰为我们描绘了一幅人机共生的未来图景,在这个新生态中,机器与人的关系将彻底实现质的跨越,这对整个社会的法律、经济体系也提出了艰巨的挑战。所以,欢迎来到未来! 在我们这个星球上,围棋和汽车都是人类的发明,而今要迎来机器人“新人类”,围棋机器人和轮式机器人正发展成为人类的伙伴,它们有智慧、有个性、有行为能力,甚至还有情感,机器人给人类带来的影响将远远超过计算机和互联网在过去几十年间已经对世界造成的改变。人类的发展史,就是人类学会运用工具、制造工具和发明机器的历史,机器使人类变得更强大。科技从不停步,人类永不满足。今天,人类正在发明越来越多的机器人,智能手机可以成为你的忠实助手,轮式机器人也会比一般人开车开得更好,曾经的很多工作岗位将会被智能机器人替代,但同时又自然会涌现出更新的工作,人类将更加优雅、智慧地生活! 人类智能始终善于更好地调教和帮助机器人和人工智能,善于利用机器人和人工智能的优势并弥补机器人和人工智能的不足,或者用新的机器人淘汰旧的机器人;反过来,机器人也一定会让人类自身更智能。 1956年,达特茅斯会议开启了人工智能的发展。经过60年的准备,人工智能终于可以奔跑了。人工智能奔跑的天梯是由移动互联网、云计算、物联网、大数据等搭建的。我们对人工智能要有敬畏之心,就好像我们对科学要有敬畏之心一样。

2019-01-04

终极算法:机器学习和人工智能如何重塑世界 PDF 电子书

作为一位机器学习领域研习10年以上的专业技术人员,我当初入行的时候没有想到,短短的10年间,这项技术会如此快速地改变众多行业,并影响全球数十亿用户生活的方方面面。在今天,当你用今日头条浏览新闻资讯的时候,当你用网易云音乐查看推荐歌单的时候,当你在百度搜索信息的时候,当你在互联网金融平台申请借款的时候,甚至在你调戏Siri和小冰的时候,其实都是其背后的机器学习算法在云端服务器中为你默默服务。但对于这样一种重要技术,市面上一直缺少一本适合普通读者的入门科普读物,而众多的专业书籍要求读者具备一定的高等数学和计算机基础算法知识,并不适合科普的需要。直到中信出版社的朋友将这本书的翻译稿推荐给我时,我欣慰地发现,这正是想了解一点机器学习的普通读者所需要的啊。本书的作者多明戈斯是华盛顿大学的终身教授,也是一位在机器学习领域具有20年研究经历的资深科学家。多明戈斯一直致力于融合各种机器学习算法的优势,提出一种可以解决所有应用问题的通用算法,即终极算法。在这本书里,作者详细地阐述了他的思路。其实我个人在阅读本书的过程中,始终对“终极算法”的提法充满怀疑。在我看来,机器学习作为人工智能领域的主流技术,在现实社会中一直以技术工具的面目为人所知。不同的技术流派和相应算法往往可以很好地解决一些问题,却对另一些问题一筹莫展。所谓的终极算法真的存在吗?如果存在,有价值吗? 可以拿内燃机举个例子,就我这个外行来说,也知道存在活塞式发动机、涡喷发动机、涡轴发动机、涡扇发动机、涡桨发动机、冲压发动机等不同种类的内燃机。不同的内燃机特性迥异,适用的工况也不尽相同。小到家用小汽车,大到导弹驱逐舰,人类制造的各种机动设备,都可以根据自己的效率需求、动力需求、寿命需求,乃至启动速度等多种需求维度选择发动机种类。如果有人非要搞个终极内燃机,并企图用这种内燃机替代现存的各类内燃机,为所有大大小小、需求不同的机动设备提供统一动力,估计大概率是要失败的。这种通用的终极内燃机如果能搞出来,在大部分领域肯定竞争不过各领域的专用内燃机,或者成本太高,或者能效太低。 带着这种疑问,我通篇读下来之后才发现作者的另一层用意。诚如作者所说,很多普通人可能没有意识到自己的生活中机器学习算法的影响已经无处不在,机器学习已经在逐渐接管现实世界。大众对这样一种技术的认知程度和该技术的重要性相比显得远远不够,在不远的未来,了解机器学习并有能力利用机器学习改进自己工作的人在职业发展上会具备巨大的优势。“不要和人工智能对抗,要让人工智能为你服务”是作者诚挚的忠告。而要利用好机器学习这个工具,并不一定需要读一个计算机博士学位,但有必要了解一些基本的概念,了解各种技术的优缺点和能力边界。正如一位称职的驾驶员不必了解具体怎么制造汽车发动机,但是对发动机的工作原理和种类还是需要略知一二的。因此,相比一板一眼地介绍机器学习的典型算法,作者设计了一个更引人入胜的套路:先抛出一个“是否存在一种终极算法”的问题,然后带着读者一章一章地回顾机器学习发展史上的重要流派和代表算法。每回顾一派,就鼓励读者思考终极算法应该如何借鉴这类算法的优点。好奇的普通读者带着疑问读完本书后,不论其是否相信终极算法的存在,至少对各类算法都会有一定的印象。以讨论终极算法为名,行科普之实,到这一步,我觉得作者的目的已经达到一半了。

2019-01-03

网络人的未来:移动互联网和大数据时代的100个预言-沈拓 电子书 pdf

PREFACE 我们都是走向未来的网络人。 “真正的领导者,要学会终局思考。也就是,你要敢于判断 5 年后的社会趋势与商业脉动。然后,站在未来看今天,很多事情就会一目了然。”20世纪曾有一部作品,启发了当时许多人的终局思考。这就是20世纪最杰出的管理学大师彼得·德鲁克,在 1942 年出版的《工业人的未来》一书。在该书中,德鲁克系统地梳理了工业社会的运行机理,建构了工业社会的蓝图全貌,预测了工业社会的未来走向。如果说,70年前,“工业人”一词可以用来刻度即将到来的工业时代。那么,70 年后的今天,我认为“网络人”一词完全可以用来刻度即将到来的移动互联网时代。如果说, 70年前,《工业人的未来》启发了人们的终局思考。那么,70年后的今天,我希望《网络人的未来:移动互联网时代的100个预言》可以帮助当代人开启终局思考。向大师致敬的最好方式是学习和创新,本书是一部致敬的作品。 “没有人能够左右变化,唯有走在变化之前。”移动互联网时代最主要的关键词是“改变”,商业格局即将改变,企业组织即将改变,人们的生活即将改变,教育和艺术即将改变,公共服务即将改变,社会心理即将改变,整个时代即将改变。本书就是对这些“改变”的预测。本书所涉及的预测,有些是可以证明的,有些是很难证明的,有些是有蛛丝马迹的逻辑推演,有些是全无实证的新颖构想。因此,与其说,本书表达的是我对于未来的种种预测,不如说,本书表达的是我对于未来的坚定信念。推动我们到达未来的不是预测而是信念,本书是一部信念的作品。 “你定义问题的水平,决定了你解决问题的水平。”在即将踏入移动互联网和大数据时代之际,我们要向自己提出好的问题,这些问题将指明我们的出路和方向。例如,“新时代需要哪些全新的观念?”“哪些行业即将发生重大改变?”“哪些商品可能会消失?”“企业管理将发生哪些重大改变?”“企业转型为什么会大多失败?”“除了商业之外,教育和艺术将发生怎样的变化?”“人类的生活形态将发生哪些改变?”“移动互联网和大数据对于未来人类不利的一面是什么?”“什么样的人是未来社会最具影响力的?”。从某种意义上,比本书 100 篇文章更重要的是,本书提出了关于未来的100个问题。比确定性答案更重要的是探索性思考,本书是一部探索的作品。 我们都是走向未来的网络人。我希望,本书能成为读者朋友探索未来的起点。从这里开始,探索未来的世界、未来的生活和未来的你。

2019-01-03

统计学习方法-李航 pdf 电子书

计算机与网络已融入到了人们的日常学习、工作和生活之中,成为人们不可或缺的助手和伙伴。计算机与网络的飞速发展完全改变了人们的学习、工作和生活方式。智能化是计算机研究与开发的一个主要目标。近几十年来的实践表明,统计机器学习方法是实现这一目标的最有效手段,尽管它还存在着一定的局限性。 作者一直从事利用统计学习方法对文本数据进行各种智能性处理的研究,包括自然语言处理、信息检索、文本数据挖掘。近20年来,这些领域发展之快,应用之广,实在令人惊叹!可以说,统计机器学习是这些领域的核心技术,在这些领域的发展及应用中起着决定性的作用。 作者在日常的研究工作中经常指导学生,并在国内外一些大学及讲习班上多次做过关于统计学习的报告和演讲。在这一过程中,同学们学习热情很高,希望得到指导,这使作者产生了撰写本书的想法。 国内外已出版了多本关于统计机器学习的书籍,比如,Hastie等人的《统计学习基础》。该书对统计学习的诸多问题有非常精辟的论述,但对初学者来说显得有些深奥。统计学习范围甚广,一两本书很难覆盖所有问题。本书主要是面向将统计学习方法作为工具的科研人员与学生,特别是从事信息检索、自然语言处理、文本数据挖掘及相关领域的研究与开发的科研人员与学生。 本书力求系统而详细地介绍统计学习的方法。在内容选取上,侧重介绍那些最重要、最常用的方法,特别是关于分类与标注问题的方法。对其他问题及方法,如聚类等,计划在今后的写作中再加以介绍。在叙述方式上,每一章讲述一种方法,各章内容相对独立、完整;同时力图用统一框架来论述所有方法,使全书整体不失系统性。读者可以从头到尾通读,也可以选择单个章节细读。对每一方法的讲述力求深入浅出,给出必要的推导证明,提供简单的实例,使初学者易于掌握方法的基本内容,领会方法的本质,并准确地使用方法。对相关的深层理论,则仅予以简述。在每章后面,给出一些习题,介绍一些相关的研究动向和阅读材料,列出参考文献,以满足读者进一步学习的需求。本书第1章简要叙述统计学习方法的基本概念,最后一章对统计学习方法进行比较与总结。此外,在附录中简要介绍一些共用的最优化理论与方法。 本书可以作为统计机器学习及相关课程的教学参考书,适用于信息检索及自然语言处理等专业的大学生、研究生。 本书初稿完成后,田飞、王佳磊、武威、陈凯、伍浩铖、曹正、陶宇等人分别审阅了全部或部分章节,提出了许多宝贵意见,对本书质量的提高有很大帮助。在此向他们表示衷心的感谢。在本书写作和出版过程中,清华大学出版社的责任编辑薛慧给予了很多帮助,在此特向她致谢。 由于作者水平所限,书中难免有错误和不当之处,欢迎专家和读者给予批评指正。来函请发至[email protected]。   李 航 2011年4月23日

2019-01-03

人工智能-[美]卢克·多梅尔.pdf 电子书

计算机的那只红眼睛能洞悉一切,它目不转睛,也不眨眼。说话的语气从容平静。 “嗨,”它说,“我们还要继续比赛吗?” 它指的是那天早些时候开始的棋局。但是你真的没有心情继续这盘棋,这不是因为计算机总是赢你(尽管这是事实),事实上,你之所以恼怒,是因为它犯下了一个令人费解的错误,这个错误与重要机器的关键部件可能出现的故障息息相关,甚至关系到你能否继续生存下去。尽管计算机坚持称这些部件已经出了故障,但你亲自检查后,却发现它们依然处于良好的工作状态。现在你想知道真正的答案。 “是的,我知道你发现它们还在正常运转,但我可以向你保证,它们将要出故障。”计算机一边说,一边试图用那种惯常的、毫无情绪的声音安抚你。 你感觉自己已经怒火中烧了。 “够了,根本不是这么回事,”你气急败坏地嚷道,“这些零件完全没有问题,我们在百分之百的过载条件下进行过测试。” “我并不是质疑你的话,但是这的确是有问题的。”计算机继续说道。 随后它又说了6个字,你知道这些话是对的,但这绝对不是你现在想听到的话:“我不可能出错。” 影迷们可以很快发现,这是斯坦利·库布里克(Stanley Kubrick)的经典电影《2001:太空漫游》中的一幕,讲的是有意识的计算机流露杀机并且企图杀死太空船中全部船员的故事。 多年以来,这曾是我们看待人工智能的方式:它是一种若隐若现的威胁,但只安全地存在科幻小说中。 但现在已经不再是这样了。

2019-01-03

机器学习系统设计 (图灵程序设计丛书)-[美]Willi Richert & Luis Pedro Coelho.pdf 电子书

前言 如果你手里(或者你的电子阅读器里)有这本书,可以说,这是一个幸运的巧合。毕竟,每年有几百万册图书印刷出来,供数百万读者阅读,而你恰好选择了这一本。可以说,正是机器学习算法引领你来阅读这本书(或者说是把这本书引领到你面前)。而我们作为本书的作者,很高兴看到你愿意了解更多的“怎么做”和“为什么”。 本书大部分内容都将涉及“怎么做”。例如,怎么处理数据才能让机器学习算法最大限度地利用它们?怎么选择正确的算法来解决手头的问题? 我们偶尔也会涉及“为什么”。例如,为什么正确评估很重要?为什么在特定情形下一个算法比另一个算法的效果更好? 我们知道,要成为该领域的专家还有很多知识要学。毕竟,本书只介绍了一些“怎么做”和极小一部分“为什么”。但在最后,我们希望这些内容可以帮你“启航”,然后快速前行。

2019-01-03

机器学习实战 (图灵程序设计丛书 72)-[美]Peter Harrington.pdf 电子书

关于本书 本书讲述重要的机器学习算法,并介绍那些使用这些算法的应用和工具,以及如何在实际环境中使用它们。市面上已经出版了很多关于机器学习的书籍,大多数讨论的是其背后的数学理论,很少涉及如何使用编程语言实现机器学习算法。本书恰恰相反,更多地讨论如何编码实现机器学习算法,而尽量减少讨论数学理论。如何将数学矩阵描述的机器学习算法转化为可以实际工作的应用程序,是本书的主要目的。

2019-01-03

R语言与网站分析 (数据分析技术丛书)-李明著.pdf 电子书

大数据下网站分析的重要性 当前,随着互联网对人们生活影响的不断增大,每天有数以亿计的用户行为数据被网站记录。这些数据以隐性信息的方式反映人们的行为习惯、兴趣爱好、性格特征,甚至是政治主张。网民每天都在告诉我们,他们到底需要什么。而这也正反映了用户的需求,可以说谁能读出用户的需求,谁就能更好地迎合用户,获取更多的流量,其网站的用户体验也就越好。 网站分析就是通过用户使用网站时留下的数据来读出用户需求、习惯、爱好的方法。同时,通过数据分析也可以驱动整个网站的优化。利用数据分析驱动网站优化是一种最科学的决策方式,它直接反映了在现实中使用网站的用户情况,而非网站产品经理或决策人想象的用户。 R语言的优势 R语言作为一个可进行交互式数据分析和探索的强大平台,被越来越多的数据分析和挖掘人员及公司所使用。其优势主要体现在以下几个方面: ·R语言的使用和学习并不需要掌握高深的语法,这使得分析师可以把更多的精力放在算法本身的实现上。 ·R语言是目前包含数据算法最全的工具,其灵活强大的绘图功能可以更好地表现数据处理结果。 ·R语言本身是免费和开源的,并与众多商业数据分析软件,如SAS等有接口。 ·R语言有搭建可视化软件的扩展包,公司可以依据自身的商业需求搭建指标监控平台。 R语言的优势使其发展势头大好,特别是在互联网公司,R语言逐渐受到了重视。对于有志成为互联网数据挖掘师/分析师的读者来说,掌握R语言将成为他们未来必备的技能之一。 编写本书的主旨 如何才能将R语言和网站分析有机地结合起来,使其价值得到体现?对于广大读者来说,很需要一本对此进行详细阐述,深入分析,指导其进行实战的图书,但是目前市面上还没有相关的图书出版,而本书的主旨正是为了填补这个空缺。相信本书会给读者带来不小的收获,并且可以把R语言更好地应用到网站分析和互联网数据挖掘的工作上。 本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学原理,力争做到对读者授之以“渔”,而非简单地授之以“鱼”。 阅读对象 ·网站数据分析师。通过阅读本书,结合公司自身的业务逻辑,使用R语言进行网站数据系统的搭建。 ·数据挖掘师。书中结合互联网的常用数据挖掘方法,给出R语言的相应实现方式,使原来以SAS/SPSS软件为基础的挖掘方案转化为以R软件为基础的挖掘方案。 ·互联网产品经理。过去网站分析系统是以自主研发或使用第三方免费工具的方式来实现的,希望通过本书可以实现以R语言为基础的新的搭建方案。 ·其他行业的数据从业人员。虽然本书与网站分析和互联网数据挖掘相结合,但里面涉及的经典分析算法是同其他行业相通的,所以对于其他行业的数据分析和挖掘也有借鉴作用。 校勘和支持 由于作者的水平有限,编写的时间也很仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。读者可以在我的个人博客www.bassary.com中留言,或直接发送至我的邮箱[email protected]。我会定期发布Bug勘误表,同时,如果你遇到任何问题,也可以通过上述途径来提问,我将尽量在线上为读者提供最满意的解答。书中的全部代码都是经过本人调试的(R语言版本为2.9.2),部分源文件会发布在我的博客中,我也会将相应的功能更新及时更正出来。 感谢 首先要感谢R语言的创建者Ross Ihaka和Robert Gentleman,他们开创了一款影响统计学乃至所有自然和社会学科的软件。 感谢沈阳理工大学,它为我大学四年提供了一个轻松而充实的学习环境。感谢我的大学导师马平全,是他培养了我如何自学和探索新学科的能力。

2019-01-03

R语言数据分析与挖掘实战 PDF 电子书

本书适用对象 ·开设有数据挖掘课程的高校教师和学生。 目前国内不少高校将数据挖掘引入本科教学中,在数学、计算机、自动化、电子信息、金融等专业开设了数据挖掘技术相关的课程,但目前这一课程的教学仍然主要限于理论介绍。因为单纯的理论教学过于抽象,学生理解起来往往比较困难,教学效果也不甚理想。本书提供的基于实战案例和建模实践的教学,能够使师生充分发挥互动性和创造性,做到理论联系实际,使师生获得最佳的教学效果。 ·需求分析及系统设计人员。 这类人员可以在理解数据挖掘原理及建模过程的基础上,结合数据挖掘案例完成精确营销、客户分群、交叉销售、流失分析、客户信用记分、欺诈发现、智能推荐等数据挖掘应用的需求分析和设计。 ·数据挖掘开发人员。 这类人员可以在理解数据挖掘应用需求和设计方案的基础上,结合本书提供的基于第三方的接口快速完成数据挖掘应用的编程实现。 ·进行数据挖掘应用研究的科研人员。 许多科研院所为了更好地对科研工作进行管理,纷纷开发了适应自身特点的科研业务管理系统

2019-01-03

R语言实战 (图灵程序设计丛书)-Robert I. Kabacoff PDF 电子书

目录 版权声明 那些年,我们一起学过的R语言 译者致谢 前言 关于本书 关于封面图片 第一部分 入门 第1章 R语言介绍 1.1 为何要使用R? 1.2 R的获取和安装 1.3 R的使用 1.4 包 1.5 批处理 1.6 将输出用为输入——结果的重用 1.7 处理大数据集 1.8 示例实践 1.9 小结 第2章 创建数据集 2.1 数据集的概念 2.2 数据结构 2.3 数据的输入 2.4 数据集的标注 2.5 处理数据对象的实用函数 2.6 小结 第3章 图形初阶 3.1 使用图形 3.2 一个简单的例子 3.3 图形参数 3.4 添加文本、自定义坐标轴和图例 3.5 图形的组合 3.6 小结 第4章 基本数据管理 4.1 一个示例 4.2 创建新变量 4.3 变量的重编码 4.4 变量的重命名 4.5 缺失值 4.6 日期值 4.7 类型转换 4.8 数据排序 4.9 数据集的合并 4.10 数据集取子集 4.11 使用SQL语句操作数据框 4.12 小结 第5章 高级数据管理 5.1 一个数据处理难题 5.2 数值和字符处理函数 5.3 数据处理难题的一套解决方案 5.4 控制流 5.5 用户自编函数 5.6 整合与重构 5.7 小结 第二部分 基本方法 第6章 基本图形 6.1 条形图 6.2 饼图 6.3 直方图 6.4 核密度图 6.5 箱线图 6.6 点图 6.7 小结 第7章 基本统计分析 7.1 描述性统计分析 7.2 频数表和列联表 7.3 相关 7.4 t检验 7.5 组间差异的非参数检验 7.6 组间差异的可视化 7.7 小结 第三部分 中级方法 第8章 回归 8.1 回归的多面性 8.2 OLS回归 8.3 回归诊断 8.4 异常观测值 8.5 改进措施 8.6 选择“最佳”的回归模型 8.7 深层次分析 8.8 小结 第9章 方差分析 9.1 术语速成 9.2 ANOVA模型拟合 9.3 单因素方差分析 9.4 单因素协方差分析 9.5 双因素方差分析 9.6 重复测量方差分析 9.7 多元方差分析 9.8 用回归来做ANOVA 9.9 小结 第10章 功效分析

2019-01-03

R的极客理想——工具篇 (数据分析技术丛书) pdf 高清版 带书签-张丹 著

我是一名程序员,前后做了10年的程序开发工作。在这10年间,我从程序员一路做到架构师,经历了太多的系统和应用。我做过手机游戏,写过编程工具;做过大型Web应用系统,写过公司内部CRM;做过SOA的系统集成,写过基于Hadoop的大数据工具;做过外包,做过电商,做过团购,做过支付,做过SNS,也做过移动SNS。以前只用Java,然后开始用PHP……如同其他程序员一样,我一度陶醉于追求各种技术的创新,但始终有一个问题困扰着我,那就是如何才能够将我所掌握的技术转变成价值?这就好比我面对着一座金山,我拥有先进的技术,可以制作各种性能稳定、功能卓越的挖掘机器,但我不懂如何将矿石提纯,变成金子!每每看到别人利用我的技术挖掘出金子时,我只能满脸的羡慕,心中无限的不甘。 直到遇见R语言,我豁然开朗。R语言为我从另外一个角度开启了宝藏的大门,也让我对自己的职业重新思考、规划,最后坚定了我向统计、金融行业的转型。

2019-01-03

MATLAB函数速查手册(修订版)-邓薇 pdf 高清版 带书签

MATLAB函数速查手册(修订版)-邓薇 MATLAB是目前流行的理论与工程仿真软件之一。该软件自产生以来,就以其独有的特点和明显的优势吸引了各行各业的工作者。本书较全面地介绍了MATLAB的函数,主要包括MATLAB操作基础、矩阵及其基本运算、与数值计算相关的基本函数、符号运算的函数、概率统计函数、绘图与图形处理函数、MATLAB程序设计相关函数、Simulink仿真工具函数、图形用户界面制作函数、信号处理工具箱函数和符号数学工具箱函数等内容。 本书立足MATLAB函数基础,并且附带较多的实例讲解,所以既适合初学者,又适合有一定经验的MATLAB使用者。本书也可以作为大专院校学生的参考用书。

2019-01-03

智能时代 pdf 高清版 带书签

大数据是当今信息社会的热词。关于数据,狭义上,在计算机科学中,数据是指所有能输入计算机并被计算机程序处理的符号介质的总称,是用于输入电子计算机进行处理的具有一定意义的数字、字母、符号和模拟量等的通称。广义上的数据,按照维基百科的定义,则是以适于更好使用或处理的方式来表示或编码的信息或知识,它可以被测量、收集和报告及分析,能够使用图形或图像来显示。按照上述定义,数据是伴随人类社会而出现的,从狭义的计算机数据的角度来看,数据从有计算机算起到现在也有70年历史了,从摩尔定律的提出到现在也有50年了。这几十年来,全球数据量按每年平均40%的速度增长,由摩尔定律所驱动的计算机处理能力也在持续增长,现在每年新増的数据量与计算机处理能力都是以前无法相比的,但数据量与计算机处理能力之比并没有因为年份而有数量级的大变化。问题是为什么现在才出现大数据热呢? 吴军先生的《智能时代》一书给出了答案。该书回顾了科学研究发展的四个范式,即描述自 然现象的实验科学、以牛顿定律和麦克斯韦方程等为代表的理论科学、模拟复杂现象的计算科学和今天的数据密集型科学。即便在实验科学和理论科学及计算科学范式时期,数据仍然起了重要作用。作者在介绍科学发展史时用实例说明了数据在科学发现中的位置,在牛顿和麦克斯韦时代,他们所导出的简洁的公式给出的确定性的规律是由大量观察数据所验证的。现在我们面对的是更复杂的自然和社会现象,多维度和多变量导致很大的不确定性,虽然还不能用解析式来说明因果关系,但如果从足够多的数据中发现相关性也能把握事物发展的轨迹,这就是数据密集型科学产生的背景。大数据的应用缘于需求,更是得益于技术的发展:互联网的宽带化和移动互联网及物联网的技术与应用源源不断产生数据,摩尔定律所支撑的计算能力几乎是以十年千倍的速度提升,云计算的集约化运用模式降低了信息化的成本,更重要的是机器智能的发展。计算机的计算与存储能力是人远远不及的,唯一不足是智能,但人的智能也不是与生俱来,只是学习的结果。机器智能可以通过深度学习得到,从而将大数据挖掘问题转化为可计算问题来处理。大数据挖掘的需求加速了机器智能技术的成熟,可以 说,大数据与机器智能相伴而生,促进物联网从感知到认知并智能决策的升华,催生了智能化时代。这是一个计算无所不在、软件定义一切、数据驱动发展的新时代。相比以蒸汽机的发明为标志以机械化为特征的第一次工业革命,以电的发明为标志以电气化为特征的第二次工业革命,现在以大数据应用为标志之一和以智能化为特征的新一轮产业革命到来了,它对 人类文明和社会进步及经济发展的影响将不亚于前两次工业革命。 读吴军先生的《智能时代》和同样出自其手的《数学之美》和《文明之光》,我感受到作者深厚的数学与物理功底。他对科学发展史研究情有独钟,见解深刻,以历史的眼光引导读者认识现代科技的发展趋势。他的书深入而浅出,既专业又通俗。《智能时代》一书与前两本书相比更关注产业变革,从工业革命谈起,顺理成章导出大数据与智能化,并积极评价了大数据与机器智能对社会与产业发展的贡献

2019-01-03

百面机器学习 kindle电子书 高清版 带书签

人工智能领域正在以超乎人们想象的速度发展,本书赶在人工智能彻底“占领”世界之前完成编写,实属万幸。书中收录了超过100道机器学习算法工程师的面试题目和解答,其中大部分源于Hulu算法研究岗位的真实场景。本书从日常工作、生活中各种有趣的现象出发,不仅囊括了机器学习的基本知识,而且还包含了成为优秀算法工程师的相关技能,更重要的是凝聚了笔者对人工智能领域的一颗热忱之心,旨在培养读者发现问题、解决问题、扩展问题的能力,建立对机器学习的热爱,共绘人工智能世界的宏伟蓝图。“不积跬步,无以至千里”,本书将从特征工程、模型评估、降维等经典机器学习领域出发,构建一个算法工程师必备的知识体系;见神经网络、强化学习、生成对抗网络等最新科研进展之微,知机器学习领域胜败兴衰之著;“博观而约取,厚积而薄发”,在最后一章为读者展示生活中各种引领时代的人工智能应用。很荣幸有机会推荐清华大学计算机系1991级校友诸葛越和她的团队写的新书《百面机器学习:算法工程师带你去面试》。 毋庸置疑,人工智能现在正在蓬勃兴起,就像生机勃发的春天,就其热度而言,说它处在夏天也十分贴切,但我更愿意把它比作收获的金秋。目前席卷全球的人工智能大潮,实际上是机器学习二三十年来理论和算法研究厚积薄发的结果(当然,还要加上与大数据和强大计算能力的风云际会),其本质属于“弱人工智能”范畴。这一波大潮恣肆到极致后一旦消退,我们期望的下一波大潮必然将是“强人工智能”所催发的,但由于其理论探索的高度困难性,尚难以设想下一波大潮什么时候才会再次奔涌而至。所以当下的我们,一定要把握住这难得的机遇,抓紧收获“弱人工智能”慷慨馈赠的足够丰硕的“果实”。可以想象,形形色色的人工智能应用将在近一两年走进千家万户,会像互联网一样,给人们的生活,给社会和经济带来深远的影响。 然而,收获并不是唾手可得的,只有有能耐摘取“果实”的人才能尽享丰收的喜悦—这就是在一线从事人工智能和机器学习工作的人们(通常也被称作算法工程师)。正是这些人,针对不同的实际应用,在不断地尝试新的方法,不断地实现新的算法。他们了解需求、收集数据、设计算法、反复实验并持续优化。他们是人工智能新一代技术的“弄潮儿”和推动者。 那么,你是否想成为他们中的一员呢?你又如何能快速成为他们中的一员呢? 也许这本书可以帮你前进一步。在人工智能技术如火如荼的时代,大批优秀的研究员和程序员正辛勤致力于解决人工智能和机器学习的实际应用问题,市场上急需这方面的技术实操书。而本书刚好填补了这方面的空白。它的内容由简至繁依次展开,涵盖了机器学习各个实用领域,并采取了举例和问答的形式,生动活泼,使每个读者既能了解人工智能从业者所需要的技能,又能学会掌握这些技能。 我从事人工智能研究已有三十余年了,研究兴趣比较广泛,涵盖了自然语言理解、机器学习、社会人文计算等,与这个领域相知相行。我认识诸葛越多年,她是我们系有名的“学霸”,曾经获得美国计算机学会数据库专业委员会十年最佳论文奖(ACM SIGMOD Test of Time Award)。回国后她也常常来系里参加活动。我了解到她的团队中的每一位成员都有非常优秀的背景。本书是工业界每天从事机器学习工作的数据科学家一起撰写的著作,它一定不会让你失望。 希望更多的朋友通过读这本书,成为更好的算法工程师、数据科学家和人工智能的实践者。我带领的研究小组最近研制了一个“九歌”古诗自动写作系统,2017年登录央视大型科学挑战类节目《机智过人》,它在节目中的表现初步达到了与人类诗人难分伯仲的程度,而其基本框架正是得益于本书讲述了的长短期记忆网络和Seq2Seq 模型。这里我姑且借用“九歌”写作的一首五绝集句诗,祝本书的所有读者都能在这个激动人心的技术新时代更上一层楼: 更上一层楼《登鹳雀楼》唐•王之涣 蝉声满树头《闲二首》唐•元稹 春光无限好《感皇恩•春水满池塘》宋•叶景山 月涌大江流《旅夜书怀》唐•杜甫 孙茂松 清华大学计算机系教授,博导,前系主任,前党委书记 2018年6月2日于清华园

2018-12-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除