自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 资源 (12)
  • 收藏
  • 关注

原创 神经网络学习-高质量资源

神经网络-深度解释 bloghttps://colah.github.io/

2020-04-19 08:25:36 275

原创 开源k-v Tair

@淘宝 Tair 开源小组https://www.cnblogs.com/lengfo/p/4171655.html欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了...

2019-09-11 17:02:58 233

原创 python re

正则表达式,向前,向后匹配,向前向后不匹配1 import re2 def testPrevPostMatch():3 # post match: (?=xxx)4 # post non-match: (?!xxx)5 # prev match: (?<=xxx)6 # prev non-match: (?<!...

2019-04-23 11:12:21 272

转载 机器学习之模型融合 Stacking

https://zhuanlan.zhihu.com/p/26890738写文章Kaggle机器学习之模型融合(stacking)心得​关注他501 人赞同了该文章此文道出了本人学习Stacking入门级应用的心路历程。在经过了几天漫长的查询资料和整理,脑子不好,理解顿悟花了不少时间。在学习过程中感谢@贝尔塔的模型融合方法,以及这篇文章(作者是章凌豪)。对于两位提供的信息,感激不尽。同时还有Ka...

2019-04-08 20:51:24 318 1

转载 intro neuron and neural network

intro to neuron and neural-networkhttps://victorzhou.com/blog/intro-to-neural-networks/Machine Learning for Beginners: An Introduction to Neural NetworksA simple explanation of how they work and how...

2019-03-27 19:48:03 372

原创 conda 设置python运行 虚拟环境

conda 设置虚拟环境在机器上可以设置多套 虚拟 python 运行环境,在不同的运行环境安装不同版本,或者不同的依赖包。查看已经创建好的环境conda info --envs创建虚拟环境conda create --name bf-predict-env python=3.6.3 pystan=2.14.0.0选定环境,并安装包source activate bf-pr...

2019-03-14 20:13:58 4567

原创 python 代码片段备忘

数组扩展predictors=[‘x’]if power&gt;=2:predictors.extend([‘x_%d’%i for i in range(2,power+1)])

2019-01-11 10:25:04 221

转载 Going Deeper into Regression Analysis with Assumptions, Plots & Solutions

摘自 ANALYTICS VIDHYA CONTENT TEAM https://www.analyticsvidhya.com/blog/2016/07/deeper-regression-analysis-assumptions-plots-solutions/ Business AnalyticsMachine LearningGoing Dee...

2019-01-07 21:27:54 891

转载 实战经验分享-少量数据NLP场景下进行深度学习训练的建议

摘自 lqfarmer 深度学习与NLPhttps://mp.weixin.qq.com/s/bGglLWd6dHcwXnX6Jqd3IA&nbsp;&nbsp;&nbsp;&nbsp;作为数据科学家,最重要的技能之一应该是为你的问题选择正确的建模技术和算法。&nbsp;几个月前,我试图解决文本分类问题,即分类哪些新闻文章与我的客户相关。&nbsp;&nbsp;&nbsp;&nbsp;我只...

2019-01-06 10:50:19 1186

转载 a comprehensive guide for linear ridge and lasso regression

https://www.analyticsvidhya.com/blog/2017/06/a-comprehensive-guide-for-linear-ridge-and-lasso-regression/

2019-01-04 20:16:46 183

转载 谈谈 Bias-Variance Tradeoff

摘自 始终 谈谈 Bias-Variance Tradeoff &lt;span itemprop="articleBody"&gt;&lt;blockquote&gt;准确是两个概念。准是 bias 小,确是 variance 小。准确是相对概念,因为 bias-variance tradeoff。——Liam Huang在机器学习领域,人们总是希望使自己的模型尽可能准...

2019-01-03 14:07:52 631

原创 如何处理小数据集线性回归问题

特征选择- 数据探查,分位数回归分析- Quantile Regression,传统统计分析数据与目标的关联; 结合业务理解,选取特征去除 异常点,和噪声限制模型的复杂度,防止过拟合,规则化L1, L2平滑化-模型多次运算结果取平均值或中值...

2019-01-03 10:02:17 1211

转载 NLP的巨人肩膀

NLP的巨人肩膀 (上)许维https://mp.weixin.qq.com/s/Rd3-ypRYiJObi-e2JDeOjQNLP的巨人肩膀 (下)许维https://mp.weixin.qq.com/s/7imMQ3GkD52xP7N4fqNPog

2018-12-29 15:50:43 235

原创 AI 资源及 blog

推荐一些比较优秀的AI资源:神经网络游乐场:https://playground.tensorflow.org/Gal Yona,在这个领域非常棒的博主之一。她的帖子包括从核心技术的解释到半哲学的评论。核心技术的解释:https://towardsdatascience.com/do-gans-really-model-the-true-data-distribution-or-are-...

2018-12-28 09:40:51 901

转载 DataFrame行列取数操作

摘自 http://bbs.fishc.com/thread-79821-1-1.htmlimport numpy as npimport pandas as pdfrom pandas import Sereis, DataFrameser = Series(np.arange(3.))data = DataFrame(np.arange(16).reshape(4,4),index=...

2018-12-27 13:55:30 668

转载 10 Exciting Ideas of 2018 in NLP

10 Exciting Ideas of 2018 in NLPSebastian Ruderhttp://ruder.io/10-exciting-ideas-of-2018-in-nlp/中文翻译 机器之心编辑从想法到实干,2018年13项NLP绝美新研究https://mp.weixin.qq.com/s/HPN7RzmnvExCkcLUXCfr2g...

2018-12-26 17:37:24 315

原创 Prophet 时间序列预测

Prophethttps://facebook.github.io/prophet/docs/contributing.html中文https://blog.csdn.net/anshuai_aw1/article/details/83412058

2018-12-25 10:59:24 998

转载 seaborn 制图

摘自 一闪一闪亮日日日日日https://www.jianshu.com/p/cce56332f80c

2018-12-21 10:16:09 278

转载 换过很多工作,却依然无法在技术公司过好一生

技术人在职场需要的技术之外的技巧摘自 boxi TGO鲲鹏会https://mp.weixin.qq.com/s/iRRxvLaKUyG3FvI4l23lpw

2018-12-21 09:49:16 147

原创 树叶子过河 全靠那股子浪劲-代码参考

HKUST-KnowComphttps://github.com/HKUST-KnowComphttps://github.com/HKUST-KnowComp/R-Nethttps://github.com/HKUST-KnowComp/MnemonicReaderberthttps://github.com/google-research/bertAn open-source NL...

2018-12-21 09:37:40 654

转载 机器学习之特征工程-数据预处理

摘自 jacksu在简书 机器学习之特征工程-数据预处理https://www.jianshu.com/p/23b493d38b5b 通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题:不属于同一量纲:即特征的规格不一样,不能够放在一起比较。无量纲化可以解决这一问题。信息冗余:对于某些定量特征,其包含的有效信息为区间划分,例如学...

2018-12-20 14:18:51 339

转载 stackingRegressor

stackingRegressorhttps://rasbt.github.io/mlxtend/user_guide/regressor/StackingRegressor/ &amp;lt;div class=&quot;col-md-3&quot;&amp;gt;&amp;lt;div class=&quot;bs-sidebar hidden-print affix well&quot; role=&quot;complem

2018-12-19 16:02:54 1627

转载 StackingClassifier

摘自 mlxtendhttps://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/ &lt;div class="col-md-3"&gt;&lt;div class="bs-sidebar hidden-print affix well" role="complementary"&gt;&lt;ul...

2018-12-19 15:57:24 1125

转载 机器学习面试之Attention

摘自 milterhttps://www.jianshu.com/p/c94909b835d61 RNN做机器翻译的经典思路 encoder-decoder用RNN做机器翻译时,通常需要两个RNN网络,一个用来将接收待翻译语句,对其进行编码,最后输出一个vector,这个网络叫encoder。然后,该vector会作为输入,传给另一个RNN网络,该网络用来根据vector产生目标语言的翻译语...

2018-12-18 17:21:28 805

转载 The Annotated Transformer

The Annotated Transformer&amp;lt;/a href=http://nlp.seas.harvard.edu/2018/04/03/attention.html &amp;gt;&amp;lt;header class=&quot;site-header&quot;&amp;gt; &amp;lt;span&amp;gt;&amp;lt;img width=&quot;30px&

2018-12-18 14:16:10 1911

转载 The Illustrated Transformer

摘自 Jay Alammar https://jalammar.github.io/illustrated-transformer/ The Illustrated Transformer In the previous post, we looked at Attention – a ubiquitous method in modern deep learni...

2018-12-18 14:12:29 875

转载 深度学习中的注意力模型(2017版)

摘自 张俊林 https://zhuanlan.zhihu.com/p/37601161注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对于关注深度学习技术发展的技术人员来说有很大的必要。人类的视觉注意力从注意力模型的命名方式看,很明显其借鉴了人类的注意力机制,因此,我们首...

2018-12-18 14:09:54 1007

转载 ValueError: Input contains NaN, infinity or a value too large for dtype('float64')

摘自 Joy-comhttps://blog.csdn.net/u013764485/article/details/53012978问题:pandas在处理数据时出现以下错误ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).解决方法:1、检查数据中是否有缺失值例如,读取...

2018-12-17 15:05:46 1236

转载 BERT相关论文、文章和代码资源汇总

摘自 我爱自然语言处理 http://www.52nlp.cn/bert-paper-%E8%AE%BA%E6%96%87-%E6%96%87%E7%AB%A0-%E4%BB%A3%E7%A0%81%E8%B5%84%E6%BA%90%E6%B1%87%E6%80%BBBERT最近太火,蹭个热点,整理一下相关的资源,包括Paper, 代码和文章解读。1、Google官方:1) BERT: ...

2018-12-16 21:14:27 369

转载 天空之城:拉马努金式思维训练法

摘自 张俊林 https://zhuanlan.zhihu.com/p/51934140本文较长,我知道大概率你没有耐心读完,但是看完可能会让你在今后的日子里多年受益,所以还请保持一些耐心。如果只对机器学习技术方面感兴趣,可以直接跳到第四部分“空中建筑师:机器学习中的拉马努金式思维训练法”。如果你选择直接跳到了第四部分开始阅读,那么从这个行为推断,你肯定是典型的算法工程师,其实第五部分“出埃及记...

2018-12-14 10:58:10 1983

转载 XGBRegressor 参数调优

摘自 大黄有故事 https://yq.aliyun.com/articles/572590这一篇博客的内容是在上一篇博客Scikit中的特征选择,XGboost进行回归预测,模型优化的实战的基础上进行调参优化的,所以在阅读本篇博客之前,请先移步看一下上一篇文章。我前面所做的工作基本都是关于特征选择的,这里我想写的是关于XGBoost参数调整的一些小经验。之前我在网站上也看到很多相关的内容,...

2018-12-12 20:17:12 49634 9

转载 LabelEncoder & OneHotEncoder

&lt;摘自 http://biggyani.blogspot.com/2014/08/using-onehot-with-categorical.html&gt;Using OneHot,LabelEncoder with categorical features/columns on a pandas dataframe, for feature selection and predicti...

2018-12-12 14:48:51 308

转载 SKlearn回归模型调包练习

摘自 一只咸狗https://blog.csdn.net/u013982164/article/details/80364500 看了录播后照着代码敲了一遍 sklearn常用分类回归算法简介 对能了解SKlearn常规套路,但模型具体的参数需要进一步了解。# 引入必要的第三方包from skl...

2018-12-11 15:47:36 727 1

转载 几个常用算法的适应场景及其优缺点

转 几个常用算法的适应场景及其优缺点(非常好)https://blog.csdn.net/u010159842/article/details/52918815 2016年10月25日 10:03:58 mishidemudong 阅读数:32162 ...

2018-12-11 13:54:03 812

转载 使用回归分析,样本过少时不妨好先看看散点图

摘自 刘重杰 https://cosx.org/2009/01/regression-with-graphics## 使用回归分析,样本过少时不妨好先看看散点图回归分析往往是学统计、学计量课程时接触的第一个统计模型了,甚至不少人可能认为回归分析理所当然成为计量的绝大部分内容——毕竟很多教材中提到统计模型的时候,往往就一个 OLS 为主的讲法。回归分析的内容当然很广泛,也在学科中占据相对基础的...

2018-12-11 10:05:48 5837

转载 如何解决过拟合 与欠拟合

转载自 谷海燕 https://blog.csdn.net/zhuanzhe117/article/details/82595958 下面这张经典的图展示了欠拟合(第一个)与过拟合(第三个)。 欠拟合模型在训练集上学习的不够好,经验误差大,称为欠拟合。模...

2018-12-08 13:57:56 248

转载 使用sklearn做单机特征工程

使用sklearn做单机特征工程 使用sklearn做单机特征工程 目录1 特征工程是什么?2 数据预处理  2.1 无量纲化    2.1.1 标准化    2.1.2 区间缩放法    2.1.3 标准化与归一化的区别  2.2 对定量特征二值化  2.3 对定性特征哑编码  2.4 缺失值计算  2.5 数据变换  2.6 回顾3 特...

2018-12-08 11:28:31 190 1

Ming of massive data sets

Ming of massive data sets, 大数据:互联网大规模数据挖掘与分布式处理,英文原版

2013-08-30

java src 源码 调优

java 性能调优,源码,很值得研究哦,共享,低资源分

2009-11-24

java cook book

java 中阶学习必备,能极大提高的编码水平,作者都是大牛,英文版的,隆重推荐

2009-11-22

cc++java软件测试面试笔试题汇总

收集了 c、c++,java,软件测试的典型入职面试题,特别时候于准备找工作的应届生,在校生,非常有用

2009-10-26

pthread programming

unix/linux 多线程编程,英文版,对多线程、进程编程讲解很深入

2009-10-26

bmp 目录 icon

chm bmp icon. CHM 在制作过程中用到了.hhp、.hhk和.hhc三个文件,修改hhc文件里的imagelist,将自己制作的BMP图标放置在ImagList 指定的位置。制作个性化的chm 目录图标

2009-08-29

chm 目录图标 icon bmp

chm目录图标比较特别,上传了MS html help 默认目录图标,及老外制作的一个图标

2009-08-29

CHM目录图标,html help自定义图标设置方法,修改hhc文件

帮助文档目录前的图标错误修改方法,CHM 在制作过程中用到了.hhp、.hhk和.hhc三个文件,介绍了默认图标的设置,及自定义图标的设置方法

2009-08-29

去掉字符串前后的空白字符, 纯c代码

Trim space at the head and tail of a string

2009-08-09

计算机网络词汇大全及名词解析

计算机网络词汇,英汉互译,及详细解释,对计算机领域,特别是计算机网络领域的词汇汇总,并有详细的词汇解释说明

2009-02-03

word论文排版技巧

论文的排版是让许多人头疼的问题,尤其是论文需要多次修改时更加令人头疼。本文将给你提供一些用Microsoft Word进行论文排版的技巧,使你的论文排版更加方便和轻松,以便把更多的精力放在论文的内容上而不是文字的编排上。这些技巧不只在论文写作中可以使用,在写其他文档时也可以使用。

2008-12-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除