自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

腾云

不忘初心,方得始终。

  • 博客(106)
  • 资源 (22)
  • 收藏
  • 关注

原创 东南大学毕业论文latex模板

东南大学毕业论文latex模板感谢seuthesix提供的模板,本仓库基于其进行二次加工和处理。推荐编辑器windows:Texstudiomac: MacTeX文件说明主要配置文件说明如下:seuthesix.cls: 核心配置文件seuthesix.cfg: seuthesix.cls运行时加载此配置文件seuthesix.bst:风格文件seuthesix.bib: 参考文献引用存放文件其他文件大多为编译生成的,如果要新建自己的项目,拷贝这四个主要文件和图片目录即可。目录说

2020-05-30 08:35:36 3052 1

原创 Spring源码阅读(一):使用IDEA搭建Spring5.0.x源码阅读环境

说明Spring源码阅读环境配置如下:Spring 5.x版本Gradle 4.8.1JDK8IDEA2020.1win10搭建步骤1. 下载Spring源码下载地址:Github链接,选择5.x版本如果Github下载过慢,可以使用码云加速,镜像地址另一种办法是通过梯子配置代理,也可以加速下载2. 配置GradleSpring基于gradle构建,需要先安装配置GradleGradle下载地址,选择complete版本,下载后加入环境变量,通过gradle -v验证是否配置

2020-05-27 17:26:18 945

转载 Linux下解压命令大全(转)

.tar解包:tar xvf FileName.tar打包:tar cvf FileName.tar DirName(注:tar是打包,不是压缩!)———————————————.gz解压1:gunzip FileName.gz解压2:gzip -d FileName.gz压缩:gzip FileName.tar.gz 和 .tgz解压:tar zxvf FileName.ta...

2019-07-22 17:48:08 309

原创 论文笔记:Comparing CNN and LSTM character-level embeddings in BiLSTM-CRF models for chemical and disease

主要工作主要目标是生物医学、化学和疾病命名实体识别,基于原来的CNN和LSTM模型加了字符向量。CNN训练速度更快,因为参数更少。数据集BioCreative VCDR corpus (Li et al., 2016).1000篇手工标注的摘要用于训练和验证,大概9193条句子500偏手工标注的摘要用于测试,大概4840条句子也用到了一个预处理过的此数据集版本,提供了POS-,ch...

2019-07-12 11:40:59 523

原创 论文笔记:ExaCT: automatic extraction of clinical trial characteristics from journal publications

背景Clinical trials对于循证医学很重要,但比较多,本文帮助医生自动抽取重要信息。方法提供一个web端工具,论文里限制了文本的条件,如下:• were written in English;• were published in the core clinical journals (asdefined by PubMed) in 2009;• had abstracts...

2019-07-05 16:52:25 212

原创 深入理解微服务实战(1):spring cloud集成zipkin报错:Prometheus requires that all meters with the same name have the

spring boot 2.0.X 的版本,整合zipkin2.11.5,可以正常启动服务,但是访问UI以后,报错如下:java.lang.IllegalArgumentException: Prometheus requires that all meters with the same name have the same set of tag keys. There is already ...

2019-06-21 11:05:26 858

翻译 论文笔记11:Relational inductive biases, deep learning, and graph networks翻译笔记

关系归纳偏置、深度学习和图网络DeepMind; Google Brain; MIT; University of Edinburgh参考https://zhuanlan.zhihu.com/p/40733008摘要人工智能近几年大火起来,在计算机视觉、自然语言处理、控制和决策等关键领域取得重大进展。这在一定程度上归因于廉价的数据和计算资源,它们符合深度学习的本质优势。然而,人类...

2019-05-24 10:13:22 3802 2

转载 tomcat在windows平台下日志乱码问题解决方案

找到tomcat/conf/logging.properties添加语句:java.util.logging.ConsoleHandler.encoding = GBK重启tomcat,查看日志数据

2019-05-21 16:34:02 1500

原创 windows下安装docker无法启动(已经安装了vmware虚拟机)

官网给出了解决办法bcdedit /set hypervisorlaunchtype offbcdedit /set hypervisorlaunchtype auto

2019-05-05 16:01:51 6916 1

原创 并发编程实战(8)任务的执行与取消

单任务顺序执行与每个任务一个线程单线程顺序执行任务,效率过低,没有发挥多核的优势。为每个任务分配一个线程去执行,速度有所提升,但是有很大的缺陷。无限制创建线程的不足生产环境中,每一个任务分配一个线程的方法存在一些缺陷,尤其是需要创建大量的线程时:线程生命周期的开销非常高。线程的创建与销毁是有代价的,延迟处理的请求,并且需要JVM和操作系统提供一些辅助操作。如果请求的到达率非常高且请求的...

2019-04-29 20:39:05 152

原创 并发编程实战(7)线程池相关

线程池的使用一、线程池概念线程池通过重用现有的线程而不是创建新线程,可以减少线程创建和销毁过程带来的巨大开销。另外一个好处是,当请求到达时工作线程通常已经存在,不会由于等待创建线程而延迟任务的执行,从而提高的响应性。通过适当调整线程池的大小,可以创建足够多的线程以便使处理器保持忙碌状态,同时还可以防止过多线程相互竞争资源而是应用程序耗尽内存或失败。创建线程池Executors中的静态工厂...

2019-04-29 20:38:08 159

原创 MySQL面试(3): 综合

数据库原理事务概念事务指的是满足 ACID 特性的一组操作,可以通过 Commit 提交一个事务,也可以使用Rollback 进行回滚。ACID原子性(Atomicity):事务被视为不可分割的最小单元,事务的所有操作要么全部提交成功,要么全部失败回滚。回滚可以用回滚日志来实现,回滚日志记录着事务所执行的修改操作,在回滚时反向执行这些修改操作即可。一致性(consisten...

2019-04-08 12:32:27 1802 1

原创 MySQL面试(2):delete、truncate和drop比较

delete可以删除整张表的数据:delete from table_name,也可以添加where子句控制要删除的数据:delete from table_name where . . .,同时可以操作view属于DML语言,每次删除一行,都在事务日志中为所删除的每行记录一项。产生rollback,事务提交之后才生效;如果有相应的 trigger,执行的时候将被触发。所以,如果删除大数据...

2019-04-07 14:45:02 505

原创 MySQL面试(1):视图

MySQL面试(1):视图视图的基本概念视图是虚拟的表,本身不包含数据,也就不能对其进行索引操作。对视图的操作和对普通表的操作一样。视图的优点简单复杂的SQL操作,比如连接操作只使用实际表的一部分数据,减小开销通过只给用户访问视图的权限,保证数据的安全性可以更改数据格式和表示面试常问1:视图能更新吗?首先肯定回答,能更新。不是所有的视图都可以更新,视图更新必须遵循以下规则(...

2019-04-07 14:22:16 739

原创 如何评估词向量?

如何评估词向量?目前词向量的评估一般分为两大类:extrinsic 和 intrinsic evaluation即内部评估和外部评估。内部评估内部评估直接衡量单词之间的句法和语义关系。这些任务通常涉及一组预先选择的查询术语和语义相关的目标词汇,我们将其称为query inventory。similarity 相关性度量当前绝大部分工作(比如以各种方式改进word embedding)都...

2019-02-19 16:24:40 1753

原创 设计模式知识点汇总

设计模式知识点汇总一、设计模式七大原则开放-封闭原则一个软件实体如类、模块和函数应该对扩展开放,对修改关闭。用抽象构建框架,用实现扩展细节。说白了,就是面向抽象编程而不是面向具体业务。当需要扩展一个功能,不是修改原来的而是增加新的类即可,有利于减少带来新的bug等。这样做能够提高软件系统的可复用性以及可维护性。依赖倒转原则高层模块不应该依赖低层模块。两个都应该依赖抽象。抽象不应该...

2019-02-18 10:45:35 1171

原创 深入理解Java虚拟机读书笔记(9): 深入理解虚拟机的类加载机制<2>

深入理解Java虚拟机读书笔记(9): 深入理解虚拟机的类加载机制&lt;2&gt;前面说到通过一个类的全限定名来获取描述此类的二进制字节流从而加载类,这个动作是在虚拟机外部实现的,以便实现自定义,实现这个动作的代码模块称为“类加载器”。一、类与类加载器对于任意一个类, 都需要由加载它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性, 每一个类加载器, 都拥有一个独立的类名称空间。...

2019-01-14 21:36:06 370 1

原创 深入理解Java虚拟机读书笔记(9): 深入理解虚拟机的类加载机制<1>

深入理解Java虚拟机读书笔记(9): 深入理解虚拟机的类加载机制&lt;1&gt;所谓类加载机制,就是虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型。在Java中,类型的加载、连接和初始化过程都是在程序运行期间完成。基于此特性,使得Java语言更加灵活,比如可以编写面向接口的程序在运行时再指定实现类;或者自己实现类...

2019-01-14 19:28:05 180

原创 深入理解Java虚拟机读书笔记(8): 深入理解类文件结构

深入理解Java虚拟机读书笔记(8): 深入理解类文件结构随着语言的发展,Java虚拟机已经不再仅仅是针对“Java”这一门语言而言了,语言无关性被越来越重视。虚拟机平台使用统一的程序存储格式字节码(ByteCode),实现平台无关性。然而,一大批在Java虚拟机上运行的语言如Clojure、Scala等发展越来越快。但是,实现语言无关性的基础仍然是虚拟机和字节码存储格式。 Java虚拟机不和包...

2019-01-12 20:06:45 214

原创 深入理解Java虚拟机读书笔记(7): 深入理解垃圾收集器

深入理解Java虚拟机读书笔记(6): 深入理解垃圾收集器前面讨论的都是理论方面的只是,垃圾收集器则是内存回收的具体实现。在介绍这些不同的垃圾收集器之前,先介绍一些其他比较重要的概念。一、重要概念GC停顿GC停顿时,整个执行系统看起来就像被冻结在某个时间点上,不可以出现分析过程中对象引用关系还在不断变化的情况,该点不满足的话分析结果准确性就无法得到保证。Sun公司称之为“Stop The ...

2019-01-08 21:20:14 178

原创 深入理解Java虚拟机读书笔记(6): 深入理解垃圾回收算法

深入理解Java虚拟机读书笔记(6): 深入理解垃圾回收算法下面就几种最常见的垃圾回收算法进行简单介绍。一、标记-清除算法“标记-清除”(Mark-Sweep)算法是最基础的收集算法,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。不足:一个是效率问题,标记和清除两个过程的效率都不高另一个是空间问题,标记清除之后会产生大...

2019-01-08 15:46:10 172

原创 深入理解Java虚拟机读书笔记(5): 判定对象的死亡

深入理解Java虚拟机读书笔记(5): 判定对象的死亡通过前面的学习已经可以知道,Java内存运行时区域中的程序计数器、虚拟机栈、本地方法栈三个区域随线程而生,随线程而灭;栈中的栈帧随着方法进入和退出有规律的进行出栈和入栈操作。同时,每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的。因此这几个区域的内存分配和回收都具备确定性,在这几个区域内就不需要过多考虑回收的问题,因为方法结束或者线...

2019-01-08 10:27:05 171

原创 深入理解Java虚拟机读书笔记(3): JDK自带工具详解汇总(不断更新)

深入理解Java虚拟机读书笔记(3): JDK自带工具详解汇总(不断更新)对于初学者来说,学习Java时可能仅仅认识了java和javac两个命令,其他的命令没有基础过。其实jdk自带了非常多的非常好用的工具,在windows环境下,打开jdk下的bin目录,可以看到很多exe文件,如下图所示:同样的,在linux环境下jdk的bin目录下也一样提供了很多工具,这些是编译好的二进制可执行脚本...

2019-01-07 16:54:27 411

原创 Git命令速查表

在其他地方看到的一个总结的非常少的Git命令list,用于记录速查,侵删

2019-01-07 16:39:59 146

原创 深入理解Java虚拟机读书笔记(4): JVM参数类型分类

深入理解Java虚拟机读书笔记(3): JVM参数类型分类JVM有很多参数,一般可以分为三大类:标准参数、X参数和XX参数标准参数所谓标准参数,即一般化参数,往往是固定不变的,比如以下参数:-help-version 显式虚拟机类型 当前版本号等等这里注意JVM默认开启了mixmode混合模式,这意味着JVM在运行时可以动态的把字节码编译成本地代码-server、-cli...

2019-01-07 13:40:30 240

原创 深入理解Java虚拟机读书笔记(2): 深入理解HotSpot虚拟机对象

深入理解Java虚拟机读书笔记(2): 深入理解HosSpot虚拟机对象为了理解虚拟机中数据的细节,比如如何创建、如何布局以及如何访问,必须具体到某一虚拟机和某一个内存区域。此处深入探讨HotSpot虚拟机在Java堆中对象分配、布局和访问的全过程。一、对象的创建反映到Java语言中,对象的创建通常不过是一个new关键字,然而反映到底层虚拟机上是如何呢?可以概括为以下三步:类加载: 虚...

2019-01-07 10:04:25 254

原创 深入理解Java虚拟机读书笔记(1):内存管理重要概念

深入理解Java虚拟机读书笔记(1):内存管理重要概念说到Java内存管理,不得不先贴一张非常经典的图,如下所示:这些模块有些是线程私有的,有的则是线程共享的。下面一一对这些模块进行介绍:一、程序计数器程序计数器一块比较小的内存空间,可以看做当前线程所执行的字节码的行号指示器,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、 循环、 跳转、 异常处理、...

2019-01-06 22:05:30 183

原创 大数据求索(15): Redis的复制原理详解

大数据求索(15): Redis的复制原理一、Redis中的复制基于Redis的复制,可以非常容易的配置和实现主从复制:从节点成为主节点的精确副本。Redis能够实现在连接断开时,从节点自动尝试连接主节点,并进行部分同步,使和主节点数据保持一致。在主从复制模式下,Master以写为主,Slave以读为主。Redis中的复制的正常运行主要依赖下面三种机制:当一个 master 实例和一个 ...

2019-01-06 14:02:12 348 2

原创 大数据求索(15): Redis事务详解

大数据求索(15): Redis事务详解一、什么是事务事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序执行。事务在执行的过程中,不会被其他客户端发送来的命令请求打断。事务是一个原子操作:事务中的命令要么全部被执行,要么全部都不执行。二、Redis中的事务2.1 常用命令MULTI、EXEC、DISCARD和WATCH是Redis事务相关的命令。MULTI:标记一个事...

2018-12-28 18:49:32 139

原创 大数据求索(14): Redis的持久化详解

大数据求索(14): Redis的持久化详解一、Redis的持久化Redis提供了两种不同的持久化方式:RDB(Redis DataBase)持久化,以指定的时间间隔对数据集进行时间点快照的保存AOF(Append only File)持久化,以日志的形式,记录服务器收到的每个写操作,不保留读操作。在服务器重启的时候,会重新顺序执行一遍写操作,以恢复数据。这两种方式可以单独开启,也可...

2018-12-25 15:47:10 157

原创 大数据求索(13): Redis数据类型详解

大数据求索(13): Redis数据类型详解一、Redis五大数据类型Redis总共有五大数据类型,分别包括以下内容:String(字符串)Hash(哈希)List(列表)Set(集合)ZSet(有序集合)丰富的数据类型使得Redis能够在非常多的场景下发挥巨大的作用,下面对这五种数据类型分别作详细介绍。二、String2.1 重要概念String是redis最基本的类型...

2018-12-25 12:48:23 357

原创 大数据求索(12): 从传统ACID到分布式系统中的CAP和BASE

大数据求索(12): 从ACID到CAP和BASE一、关于ACID关系型数据库最强大的功能之一就是事务,能够保证数据的强一致性。事务有如下几个特性:1.1 A(Atomicity) 原子性原子性很容易理解,也就是说**事务里的所有操作要么全部做完,要么都不做,事务成功的条件是事务里的所有操作都成功,只要有一个操作失败,整个事务就失败,需要回滚。**比如银行转账,从A账户转100元至B账户,...

2018-12-24 21:55:56 266

原创 大数据求索(11): 为什么选择NoSQL

大数据求索(11): 为什么选择NoSQL一、背景1.1 单机MySQL起初互联网网站访问量一般都不打,用单个数据库可以轻松应付。此外,刚开始的网站大多数是静态网页,动态交互类型的网站不多。在此种架构模式下,数据存储的瓶颈是什么呢?数据量的总大小,一个机器放不下时数据的索引(B+Tree)一个机器的内存放不下时访问量(读写混合)一个实例不能承受时这种情况下,就需要进行改进。...

2018-12-24 16:29:09 684

原创 大数据求索(10): 解决ElasticSearch中文搜索无结果------ik分词器的安装与使用

大数据求索(10): 解决ElasticSearch中文搜索无结果-----IK中文分词器的安装与使用问题所在在中文情况下,ES默认分词器会将汉字切分为一个一个的汉字,所以当搜索词语的时候,会发现无法找到结果。解决办法有很多其他的分词器插件可以替代,这里使用最常用的IK分词器。IK分词器安装注意:ik分词器必须和ES版本严格对应,否则可能会产生意料之外的错误。Github地址:...

2018-12-22 16:46:15 2775

原创 大数据求索(9): log4j + flume + kafka + spark streaming实时日志流处理实战

大数据求索(9): log4j + flume + kafka + spark streaming实时日志流处理实战一、实时流处理1.1 实时计算跟实时系统类似(能在严格的时间限制内响应请求的系统),例如在股票交易中,市场数据瞬息万变,决策通常需要秒级甚至毫秒级。通俗来说,就是一个任务需要在非常短的单位时间内计算出来,这个计算通常是多次的。1.2 流式计算通常指源源不断的数据流过系统,系...

2018-12-16 18:39:00 610

原创 大数据求索(8):Spark Streaming简易入门一

大数据求索(8):Spark Streaming简易入门一一、Spark Streaming简单介绍Spark Streaming是基于Spark Core上的一个应用程序,可伸缩,高吞吐,容错(这里主要是借助Spark Core的容错方式)处理在线数据流,数据可以有不同的来源,以及同时处理不同来源的数据。Spark Streaming处理的数据可以结合ML和Graph。Spark Stre...

2018-12-09 20:46:44 394

原创 # 大数据求索(7): Kafka的重要原理和概念二与实战

大数据求索(7): Kafka的重要原理和概念二大数据最好的学习资料是官方文档。Kafka官方文档地址:http://kafka.apache.org/四、Kafka高效性相关设计4.1 消息的持久化Kafka高度依赖文件系统来存储和缓存消息,一般的人认为磁盘是缓慢的,这导致人们对持久化结构具有竞争性持怀疑态度。其实,磁盘远比你想象的要快或者慢,这决定于我们如何使用磁盘。一个和磁盘...

2018-12-09 18:54:04 708

原创 大数据求索(7): Kafka的重要原理和概念一

大数据求索(7): Kafka的重要原理和概念一大数据最好的学习资料是官方文档。Kafka官方文档地址:http://kafka.apache.org/一、Kakfa简介Apache kafka 是一个分布式的基于push-subscribe的消息系统,它具备快速、可扩展、可持久化的特点。它现在是Apache旗下的一个开源系统,作为hadoop生态系统的一部分,被各种商业公司广泛应用。...

2018-12-09 16:47:28 2159

原创 大数据求索(6): 使用Flume进行数据采集单机监控端口、监控文件、跨节点等多种方式

大数据求索(6): 使用Flume进行数据采集大数据最好的学习资料是官方文档。Flume官方文档地址http://flume.apache.org/Flume简单介绍Flume是一种分布式的、可靠的且可用的服务,用于高效收集、聚合和移动大量日志数据。它具有基于流式数据的简单灵活架构。它具有可靠性机制和许多故障转移和恢复机制,具有强大的容错能力。它使用简单的可扩展数据模型,允许在线分析应...

2018-12-09 11:39:10 1043

原创 大数据求索(5):Windows下使用IDEA开发Kafka程序和服务器通信失败问题

问题描述在windows下使用IDEA开发完生产者程序以后,在服务器端开启消费者进程,发现发送失败,无法进行通信,报错如下:kafka .FailedToSendMessageException: Failed to send messages after 3 tries大概意思便是尝试3次发送消息都失败了,那么是什么原因呢?排查很久,代码没有问题,问题应该是出在找不到服务器上。解决办...

2018-12-06 13:59:05 298

iclr_2019.pdf

Cynthia Dwork:算法公平性的进展 Leon Bottou:Learning Representations Using Causal Invariance Emily Shuckburgh:机器学习能否有助于地球健康的检查 Ian Goodfellow:对抗机器学习 Pierre-Yves Oudeyer:发展自主学习:人工智能,认知科学和教育技术 Zeynep Tufekci:虽然我们都担心机器学习的失败,但如果它成功了,潜伏着什么危险? Mirella Lapata:用神经模型学习自然语言界面 Noah Goodman:在上下文中学习语言

2019-05-11

40页 PPT,BMM夏令营《强化学习简明教程》下载

BMM (Brains, Minds, and Machines Summer Course)是一美国国家科学基金会资助的一个科学技术中心,致力于AI相关的跨学科研究。这是一个多机构合作的项目,总部设在麻省理工学院麦戈文大脑研究所(McGovern Institute for Brain Research at MIT),管理合伙人在哈佛大学(Harvard University)。 BMM 在2018夏令营,用到的《强化学习简明教程》

2018-09-21

246页《统计机器学习与凸优化》教程PPT下载

统计机器学习(Statistical Machine Learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。凸优化(convex optimization)是指一种比较特殊的优化,是指求取最小值的目标函数为凸函数的一类优化问题。两者都是现代机器学习研究和实践的重要理论基础。今天给大家带来的是由INRIA的Francis Bach主讲的246页《统计机器学习与凸优化》教程。 教程大纲: 介绍(Introduction) 凸优化的经典方法(Classical methods for convex optimization) 非光滑随机近似(Non-smooth stochastic approximation) 平滑的随机近似算法(Smooth stochastic approximation algorithms) 有限数据集(Finite data sets)

2018-09-21

微软剑桥研究院153页最新GAN教程(附代码)

ebastian Nowozin是微软剑桥研究院首席研究院,专注于无监督于表示学习。他在GAN领域做了大量的工作,同时也是著名的f-GAN的作者。 在训练 GAN 方面似乎有两三个阵营:第一个当然就是GAN的发明Ian Goodfellow以及他所供职的OpenAI和谷歌的一帮研究人员;第二个强大的阵营也就是以这篇教程作者Sebastian Nowozin 为代表的微软阵营;第三就是其他了。 此次教程主要有以下几个部分: 概率模型 GANs的几个示范应用 评价原则 GAN 模型 差异性与f-GAN 家族 基于积分概率度量(IPM)的GAN: MMD 基于积分概率度量(IPM)的GAN: Wasserstein GANs 问题与如何修正:模式崩溃(modecollapse)与不稳定性(Instability) 隐式模型 开放性研究问题

2018-09-11

中国中文信息学会发布《2018知识图谱发展报告》

中国中文信息学会发布《2018知识图谱发展报告》报告目录如下(文末附下载链接) 第一章 知识表示与建模 第二章 知识表示学习 第三章 实体识别与链接 第四章 实体关系学习 第五章 事件知识学习 第六章 知识存储与查询 第七章 知识推理 第八章 通用和领域知识图谱 第九章 语义集成 第十章 语义搜索 第十一章 基于知识的问答

2018-09-08

美团大脑: 知识图谱的建模方法及其应用

美团大脑:知识图谱的建模方法及其应用,美团AI平台部NLP中心负责人大众点评搜索智能中心负责人,。美团点评AI平台部NLP(自然语言处理)中心于2018年2月正式成立 • 愿景:用人工智能帮大家吃得更好,生活更好 • NLP (Natural Language Processing) :语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之 一,其核心是让机器像人类一样理解和使用语言

2018-09-05

清华-中国工程院知识智能联合实验室AMiner发布的《2018自然语言处理研究报告》

自然语言处理是人工智能的一个重要应用领域, 也是新一代计算机必须研究的课题。它 的主要目的是克服人机对话中的各种限制,使用户能用自己的语言与计算机对话。本研究报 告对自然语言进行了简单梳理,包括以下内容: 自然语言处理概念。 首先对自然语言处理进行定义,接着对自然语言的发展历程进行了 梳理,对我国自然语言处理现状进行了简单介绍,对自然语言处理业界情况进行介绍。 自然语言处理研究情况。 依据 2016 年中文信息学会发布的中文信息处理发展报告对自 然语言处理研究中的重要技术进行介绍。 自然语言处理领域专家介绍。 利用 AMiner 大数据对自然语言处理领域专家进行深入挖 掘,对国内外自然语言处理知名实验室及其主要负责人进行介绍。 自然语言处理的应用及趋势预测。 自然语言处理在现实生活中应用广泛,目前的应用集 中在语言学、数据处理、认知科学以及语言工程等领域,在介绍相关应用的基础上,对机器 翻译未来的发展趋势做出了相应的预测

2018-07-27

AI 顶级国际会议 IJCAI 斯坦福大学PH.D Aditya Grover报告深度生成模型Deep Generative Model

生成模型是图模型与概率编程语言中概率推理的核心范例,最近由于神经网络在参数化方面的改进、以及基于梯度随机优化方面的进展,使得可以对高维数据进行跨模态建模。 本教程的前半部分,将全面介绍深度生成模型,包括生成对抗网络、变分自编码器以及自回归模型。对于每一个模型,我们都将深入探讨各自的概率公式、学习算法、以及与其他模型的关系。后半部分将演示一组具有代表性的推理任务,展示深度生成网络在其中的应用。最后,我们将讨论堂前领域面临的挑战,并展望未来的研究方向。 目录 第一部分: 生成模型的动机,以及与判别模型的对比 生成模型的定义、特征、估计密度、模拟数据、学习表示 传统生成模型方法,以及深度网络在参数化方面的作用 基于学习算法的生成模型分类,基于相似点的学习和无相似点的学习 Likelihood-based学习实例 自回归模型 变分自编码器 第二部分: Likelihood-based学习实例(续) 规范化流模型 Likelihood-free 学习实例 生成对抗网络 深度生成模型的实例 半监督学习 模仿学习 对抗样本 压缩感知 关于生成模型未来研究的主要挑战和展望。

2018-07-25

机器学习之特征工程

机器学习之特征工程介绍,一步一步告诉你如何进行特征工程~

2018-05-02

美团点评技术团队算法技术

《2018美团点评技术年货(合辑)》过去的一年,美团点评作为全球领先的一站式生活服务互联网平台, 在吃喝玩乐住行等 200 多个品类,2800 多个城区县,服务了亿万消费 者、数百万商家,日订单数超过 2200 万,年度交易总额达到了 3600 亿。 2017 年 10 月最新一轮融资,300 亿美元的估值,也使我们进入全 球独角兽的最前列。

2018-04-19

阿里技术图册-开发篇

速度收藏!600页阿里技术全景图曝光,程序员看完都沸腾了。如果你不甘心一直在写增删改查,希望看到更广的技术世界,阿里技术团队重磅发布的《阿里技术参考图册》,总计 600 余页,现已开放下载,将为你呈现阿里技术全景,走进各个技术领域的世界。 此书邀请了阿里多个重要部门的研究员、资深技术专家、资深算法专家参与撰写。内容分为研发篇、算法篇两册,全面展示了在超大规模的企业级应用需求下,阿里全新升级的大中台、小前台的技术组织架构,以及各个技术领域的突破及创新。

2018-04-17

阿里技术参考图册-算法篇

速度收藏!600页阿里技术全景图曝光,程序员看完都沸腾了。如果你不甘心一直在写增删改查,希望看到更广的技术世界,阿里技术团队重磅发布的《阿里技术参考图册》,总计 600 余页,现已开放下载,将为你呈现阿里技术全景,走进各个技术领域的世界。此书邀请了阿里多个重要部门的研究员、资深技术专家、资深算法专家参与撰写。内容分为研发篇、算法篇两册,全面展示了在超大规模的企业级应用需求下,阿里全新升级的大中台、小前台的技术组织架构,以及各个技术领域的突破及创新。

2018-04-17

阿里巴巴Java开发手册(官方最新版)

阿里巴巴Java开发手册(官方最新版),终极版本,官方发布

2018-04-17

2014计算机考研复试c++笔试题

2014计算机考研复试c++笔试题,学长回忆总结版本,给考研的提供 参考

2018-04-11

东南大学计算机复试553C++教材 东南大学软院初试推荐c++教材

东南大学计算机复试553C++教材,包括《C++语言程序设计(第4版)》.(郑莉,董渊)以及课后习题答案,钱能-C++ 程序设计(第二版)以及课后习题答案

2018-04-11

最容易理解的LDA资料

LDA八卦,最容易理解LDA算法的介绍文章,包括详细的数学推导和过程!

2018-04-07

最优化与KKT条件(最好的最优化书籍)

最优化与KKT条件,最好的凸优化入门书籍,简短精炼,易于理解,对于学习深度学习打下基础具有很大的帮助!

2018-04-07

DeepLearning参考论文

DeepLearning参考论文,分类好打包下载,阅读原始论文可以更方便理解内容

2018-04-07

人脸识别数据集

包括ORL人脸库、Yale人脸库、AT&T人脸库及MIT人脸库。ORL人脸库中包括23*28的bmp格式的400幅人脸、92*112的bmp格式及pgm格式的各400幅人脸;Yale人脸库中包括100*100的bmp格式的15个人的人脸,每个人11幅图像;MIT人脸库中包括人脸20*20的bmp格式2706幅图及非人脸20*20的bmp格式4381幅图

2018-04-07

pytorch实现人脸识别包括人脸检测(opencv、dlib、CNN三种方法融合)人脸对齐和vgg-face人脸特征提取

博客地址:https://blog.csdn.net/wen_fei/article/details/80261047 人脸识别源代码,包括使用opencv、dlib和cnn实现的人脸检测、opencv实现的人脸对齐以及vgg-face的人脸特征提取等,最后余弦函数计算相似度,并提供flask部署代码,可以放在服务器上远程调用

2018-04-02

VGG-Face Pytorch版模型

博客地址:https://blog.csdn.net/wen_fei/article/details/80261047 VGG-Face模型Pytorch版本,使用Pytorch的torch.load(VGG_FACE_LOCATION)可直接读取,基于千万张人脸数据训练,

2018-04-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除