自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(127)
  • 收藏
  • 关注

原创 AICUG人工智能技术沙龙

2019年03月24日 13:00 - 17:30 上海长宁区福泉路111号神州数码本期由来自Intel、竹间智能、PinLan的老师为大家带来AI纯技术干货分享,现场参与讲师提问互动还可获得技术书籍和精美礼品哦!关于AICUGAICUG(AI中国用户组)www.aicug.cn,致力于为人工智能从业者及AI技术爱好者提供技术交流和知识共享的平台。社区专注于人工智能技术探索包括机器人、语...

2019-03-12 14:17:45 2999

原创 高并发应用中的数据库系统设计实践

本次分享高并发应用场景介绍,对数据库可能带来的压力,如何从内核、数据库架构方面解决高并发场景调度问题。同时介绍阿里云RDS PG相比社区版本有哪些优势,客户CASE原文&地址https://www.slidestalk.com/s/aliyun_Design_and_practice_of_database_system_in_high_concurre...

2019-02-28 17:05:12 292

原创 大规模日志数据企业级分布式平台架构面临的问题与挑战

本次分享大规模日志数据企业级分布式平台架构面临的问题与挑战,架构之争和演进之路,当前架构的关键技术,未来架构优化思考。原文&下载https://www.slidestalk.com/s/Enterprise_Distributed_Platform_Architecture...

2019-02-28 17:02:57 265

原创 Sizing the prize What’s the real value of AI for your business and how can you c

Artificial intelligence (AI) can transform the productivity and GDP potential of the global economy. Strategic investment in different types of AI technology is needed to make that happen.Labour prod...

2019-02-28 17:00:39 294

原创 强化学习在阿里的技术演讲与业务创新

当前的机器学习算法⼤致可以分为有监督的学习、⽆监督的学习和强化学习(Reinforcement Learning)等。强化学习和其他学习⽅法不同之处在于强化学习是智能系统从环境到⾏为映射的学习,以使奖励信号函数值最⼤。如果智能体的某个⾏为策略导致环境正的奖赏,那么智能体以后产⽣这个⾏为策略的趋势便会加强。强化学习是最接近于⾃然界动物学习的本质的⼀种学习范式。然⽽强化学习从提出到现在,也差不多有半个...

2019-02-28 16:58:41 449

原创 携程技术2018年度合辑

这本书作为 2018 年携程技术的结晶,集合来自携程技术中心微信公众号全年度的重要技术文章,涵盖了从无线大前端到后端架构,从大数据到 AI 应用,从研发质量到 DevOps 几乎所有主流的互联网技术方向。总共 69 篇,细分为 8 个领域:人工智能、架构、无线大前端、 大数据、质量、运维、数据库、风险控制。原文&下载https://www.slidestalk...

2019-02-28 16:56:37 351

原创 Kafka quick start

原文&地址https://www.slidestalk.com/s/Kafkaquickstart49206

2019-02-27 23:35:43 1148

原创 2019.02.23-中国银联-Apache Kylin 在中国银联的实践

讲师:王颖卓 中国银联 科技事业部高级主管演讲概要:10年前,中国银联建成了统一的企业级数据仓库,确立了以 IBM Cognos 为核心的多维分析应用。经过10年的积累,IBM Cognos 在各个方面都迎来了巨大的挑战。经过选型验证,中国银联把以 Apache Kylin 为核心的 Kyligence 作为大数据多维分析的核心技术组件,并在 Kyligence 的基础之上进行了定制化的开发。...

2019-02-26 22:21:56 333

原创 2019.02.23-eBay-Apache Kylin Real-time Streaming

讲师:马刚 eBay 资深工程师演讲概要:为什么要做新的 Kylin streaming, 及其特点新 Kylin Streaming 的总体架构及组件HA 及列存储设计消费及查询性能原文&下载https://www.slidestalk.com/s/apache_kylin_realtime_streaming...

2019-02-26 22:19:10 174

原创 2019.02.23-携程-Apache Kylin 在携程大数据平台的优化及演进

讲师:张巍 携程 大数据资深研发工程师演讲概要:本次分享将介绍携程在使用 Kylin 的过程中遇到的挑战和相关优化以及对于未来的展望。原文&下载https://www.slidestalk.com/s/apache_kylin_ctrip_optimization_evolution...

2019-02-26 22:17:01 214

原创 2019.02.23-Kyligence-为 Apache Kylin 快速开发新数据源

讲师:李栋 Kyligence 技术合伙人兼生态合作技术总监演讲概要:从v2.6.0版本开始,Apache Kylin 提供了一个Data Source SDK的功能,可以帮助开发者通过快速开发,实现Apache Kylin与新数据源的对接。通过JDBC接口,Apache Kylin可以从新数据源构建Cube、查询下压,满足企业在数据湖进行自助分析的需求。本次分享将对这一SDK的原理、最佳实践进...

2019-02-26 22:13:42 342

原创 2018 HBase技术总结

HBase 是一个高性能,并且支持无限水平扩展的在线数据库,其存储计算分离的特性非常好地适应了目前的趋势,并且在国内大公司内都被广泛地应用,具有非常好的生态,是构建大数据系统的不二选择。原文&下载https://www.slidestalk.com/s/HBase_ebook28532...

2019-02-26 22:10:33 344

原创 DH内存分析引擎

DH内存分析引擎专为高性能和大数据分析构建,比传统数据库 快 50x – 1000x。且基于工业化标准服务器,从TB 到 PB 快速扩展。原文链接及下载https://www.slidestalk.com/s/DH97246...

2019-02-21 23:08:57 200

原创 专注dApp高效执行和高并发的下一代公有链

Dora网络从三个方面来解决区块链目前性能不足的问题:纵向扩容,横向扩容和分层共识算法(DVBC),从而达到商业应用级别的TPS;并且兼容EVM,以便于现有dApp的快速移植。原文&下载https://www.slidestalk.com/s/dora_2018_1120_ppt82991...

2019-01-28 18:48:06 136

原创 数据仓库

数据仓库是一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。集成:将多个分散的数据源统一成一致的、无歧义的数据格式后放置到数据仓库中,解决命名冲突、计量单位不一致等问题;随时间变化:数据仓库中的数据反映了某一历史时间点的数据快照;非易失:一旦进入数据仓库中,数据就不应该再有改变。数据仓库中的粒度是指数据的细节或汇总程度,细节程度越高,粒度级别越低。数据仓库...

2019-01-28 18:43:13 136

原创 Go在区块链的发展和演进

Go语言发展至今已经过去十年多了,是目前最流行的新兴语言,云计算领域的首选语言,而且目前随着区块链的流行,Go再次成为了这个领域的第一语言,以太坊,IBM的fabric等重量级的区块链项目都是基于Go开发。原文&下载https://www.slidestalk.com/s/Go_at_Development_and_Evolution_of_Block_Cha...

2019-01-28 18:38:23 179

原创 GraphLab: A New Framework For Parallel Machine Learning

原文&下载https://www.slidestalk.com/s/graphlab19587

2019-01-28 18:34:35 329

原创 微软亚洲研究院27篇论文入选AAAI 2019

人工智能领域的国际顶级会议AAAI 2019将于1月27日至2月1日在美国夏威夷举行。根据已经公布的论文录取结果,今年的大会录取率创历史新低,投稿数量高达7745篇,录取的数量仅有16%左右。但在被录取的论文中,来自微软亚洲研究院的却有27篇之多,包括了机器学习、自然语言处理(NLP)、计算机视觉和图形学等多个领域。本文将详细介绍这三个领域中来自微软亚洲研究院的那些硬核论文。机器学习非自回归机...

2019-01-28 18:30:27 646

原创 Java开发手册

原文&下载https://www.slidestalk.com/s/Java21492

2019-01-25 18:17:16 118

原创 Scala在互联网金融中的应用

原文&下载https://www.slidestalk.com/s/ScalaUSTC60

2019-01-25 18:13:18 328

原创 邹丹_Flink在字节跳动的实践

原文&下载[https://www.slidestal

2019-01-25 18:07:34 756

原创 Large-Scale Data Processing with MapReduce

介绍了MapReduce的诞生的背景,基本原理,算法思想,以及如何用于文本挖掘,管理关系型数据,如何进行图计算及常用图计算的实现伪代码(Dijkstra’s / BFS / PageRank),最后谈到了大数据之上的存储HDFS/HBASE以及Hive和Pig。虽然不是最新的流行趋势,但是已经把大数据领域最基本的问题讲清楚了。原文&下载https://www....

2019-01-25 18:04:01 123

原创 分布式计算平台介绍

分布式计算系统平台是将一系列用计算机网络相连接通信的,独立计算的模式和组件,集成到一个统一的平台,展现给用户的是一个完整的独立计算平台。本文介绍分布式计算平台的基本概念和不同计算模式,并对当前最为流行的Apache Spark / Hadoop原理做深入分享。原文&下载https://www.slidestalk.com/s/distributed_platf...

2019-01-25 17:59:33 2924

原创 Kyligence公开课-Apache Superset设计与SQL查询

本次公开课邀请了 Kyligence 公司的 Python 全栈工程师赵勇杰为我们讲解Apache Superset。课程通过讲解 Superset 代码,使您可以快速了解 Superset 的系统设计,其中包含:Superset 系统架构、Superset 代码结构讲解、可视化查询到 SQL 生成过程。原文&下载https://www.slidestalk....

2019-01-24 19:03:38 234

原创 Introduction to Spark

Spark’s goal was to generalize MapReduce to support new applications within the same engineTwo additions:Fast data sharingGeneral DAGs (directed acyclic graphs)Best of both worlds: easy to program...

2019-01-24 19:00:23 122

原创 大规模日志数据企业级分布式平台架构面临的问题与挑战

本次分享大规模日志数据企业级分布式平台架构面临的问题与挑战,架构之争和演进之路,当前架构的关键技术,未来架构优化思考。原文&下载https://www.slidestalk.com/s/Enterprise_Distributed_Platform_Architecture...

2019-01-24 18:56:30 142

原创 A View of Cloud Computing

Our goal in this article is to reduce that confusion by clarifying terms, providing simple figures to quantify comparisons between of cloud and conventional computing, and identifying the top technica...

2019-01-24 18:49:52 676

原创 How to Design a Good API and Why it Matters

为什么API设计很重要?API可能是一个公司/一个产品最重要的资产,你的客户可能会因为它好用,开始学习,付费购买并使用它们,并让客户们觉得离开你的API是需要付出巨大代价的,好的API设计会轻易俘获客户的心。当然API也可能会成为一个公司最大的债务,拙略的API设计可能会让你疲于应付你的用户支持。请记住,公共API一旦定义,就会一直被使用,你只有一次机会,那就是在最开始的时候把它定义设计好。如何设...

2019-01-24 18:46:41 184

原创 ABRiS: Avro bridge for Apache Spark

ABRiS是来非洲的金融服务供应商,他们利用Apache Spark作为核心的数据处理引擎,本篇会讲解他们在Spark以及Spark生态中的工作贡献。原文&下载https://www.slidestalk.com/s/abris_avro_bridge_for_apache_spark_1548134566963...

2019-01-23 19:28:43 147

原创 The Data Ecosystem 2.0

Alluxio创始人&CEO李浩源博士在2018 BDTC大会上的主题演讲。介绍大数据和AI时代计算存储架构的演进,以及Alluxio在生态系统中的位置。想要了解更多Alluxio,访问官网alluxio.org原文&下载https://www.slidestalk.com/s/Alluxio_BDTC2018_Keynote...

2019-01-23 19:26:09 202

原创 Go在区块链的发展和演进

Go语言发展至今已经过去十年多了,是目前最流行的新兴语言,云计算领域的首选语言,而且目前随着区块链的流行,Go再次成为了这个领域的第一语言,以太坊,IBM的fabric等重量级的区块链项目都是基于Go开发。原文&下载篇https://www.slidestalk.com/s/Go_at_Development_and_Evolution_of_Block_Cha...

2019-01-23 19:23:11 198

原创 桑文锋《数据化建设的时代机遇》

一家企业落地数据驱动包括三个层面:第一层是高层建立数据驱动意识; 第二层是公司的整体业务流程的改造,并将数据驱动引入;第三层是真正的落地层面。原文&下载https://www.slidestalk.com/s/74258...

2019-01-23 19:17:40 143

原创 Spark Structured Streaming

With the ubiquity of real-time data, organizations need streaming systems that are scalable, easy to use, and easy to integrate into business applications. Structured Streaming is a new high-level str...

2019-01-23 19:15:19 162

原创 小红书社区技术

本次分享,郭一主要介绍了小红书社区的数据技术。首先介绍了小红书的产品和社区个性化的推荐需要的关键技术。然后对社区的数据技术分别从接入层,业务层,数据服务层和数据仓库层进行了概述。然后讲述了一个利用流计算引擎Flink给线上推荐提供用户行为实时的多维度聚合的业务实例。最后对小红书下一年的数据架构发展进行的展望。原文&下载https://www.slidestalk...

2019-01-22 19:24:07 2837

原创 TiDB在小红书的实践案例分享

原文&下载https://www.slidestalk.com/s/TiDB_red

2019-01-22 19:22:02 689

原创 PayPal merchant ecosystem using Apache Spark, Hive, Druid,

As one of the few closed-loop payment platforms, PayPal is uniquely positioned to provide merchants with insights aimed to identify opportunities to help grow and manage their business. PayPal process...

2019-01-22 19:20:10 107

原创 Vectorized Execution Explained

向量化是随着列存数据库一起成熟的新查询执行模型,诸如Hive,Vertica,Vectorwise,Clickhouse等都使用了该技术。向量化也是 TiDB 正在进行的优化之一。本次分享将从为何进行向量化,块执行,SIMD和晚期物化等多个方面阐述向量化引擎的设计和实现。原文&下载https://www.slidestalk.com/s/Vectorized_E...

2019-01-22 19:17:42 278

原创 标签体系应用及设计思路

标签画像是精准营销、产品应用的中间层基础,可以实现的业务价值包含基于用户群体的生命周期管理、高价值客户深入开发、交叉营销,也可以输出用于个性化推送、个性化推荐以及个性化实时营销,同时也是数据分析和用户分析的属性源,具备非常强的应用价值。标签体系的建设,核心是从应用场景和商业目的出发,基于对业务形态和策略的理解之上,从业务需求反推标签及体系设计,同时也强调了标签的管理和可持续维护的重要性,并分享了某...

2019-01-22 19:14:03 3451

原创 【干货】数据库论文专题

今天分享一份关于数据库的论文资料专题,对数据库方面进行了很深的研究。此专题共71篇文档或论文,基本囊括了关于日常数据库搭建,维护,测试,优化,CPU,OLAP,并发分析与编译等方面的问题。https://www.slidestalk.com/x/227/database/...

2019-01-21 19:26:12 686

原创 企业级数据库POLARDB介绍&优化分享

PolarDB优化分享:PolarDB主要有五大核心优势:兼容性PolarDB兼容了当下最主流的、开发者最喜欢用的MySQL和PostgreSQL两种数据库生态,这意味着MySQL和PostgreSQL的老用户,在一行代码不用改的前提下,可以把业务从原来的开源数据库迁移到阿里云的企业数据库平台上。性能好对比MySQL有6倍性能提升及相对于商业数据库实现大幅度降低成本。拿Sysbench跑B...

2019-01-21 19:19:41 1185

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除