csiao_Bing-CSDN博客

原创神经网络学习-高质量资源

神经网络-深度解释 bloghttps://colah.github.io/

2020-04-19 08:25:36 275

原创开源k-v Tair

@淘宝 Tair 开源小组https://www.cnblogs.com/lengfo/p/4171655.html欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了...

2019-09-11 17:02:58 233

原创 python re

正则表达式，向前，向后匹配，向前向后不匹配1 import re2 def testPrevPostMatch():3 # post match: (?=xxx)4 # post non-match: (?!xxx)5 # prev match: (?<=xxx)6 # prev non-match: (?<!...

2019-04-23 11:12:21 272

https://zhuanlan.zhihu.com/p/26890738写文章Kaggle机器学习之模型融合（stacking）心得关注他501 人赞同了该文章此文道出了本人学习Stacking入门级应用的心路历程。在经过了几天漫长的查询资料和整理，脑子不好，理解顿悟花了不少时间。在学习过程中感谢@贝尔塔的模型融合方法，以及这篇文章（作者是章凌豪）。对于两位提供的信息，感激不尽。同时还有Ka...

2019-04-08 20:51:24 318 1

转载 intro neuron and neural network

intro to neuron and neural-networkhttps://victorzhou.com/blog/intro-to-neural-networks/Machine Learning for Beginners: An Introduction to Neural NetworksA simple explanation of how they work and how...

2019-03-27 19:48:03 372

原创 conda 设置python运行虚拟环境

conda 设置虚拟环境在机器上可以设置多套虚拟 python 运行环境，在不同的运行环境安装不同版本，或者不同的依赖包。查看已经创建好的环境conda info --envs创建虚拟环境conda create --name bf-predict-env python=3.6.3 pystan=2.14.0.0选定环境，并安装包source activate bf-pr...

2019-03-14 20:13:58 4567

原创 python 代码片段备忘

数组扩展predictors=[‘x’]if power>=2:predictors.extend([‘x_%d’%i for i in range(2,power+1)])

2019-01-11 10:25:04 221

转载 Going Deeper into Regression Analysis with Assumptions, Plots & Solutions

摘自 ANALYTICS VIDHYA CONTENT TEAM https://www.analyticsvidhya.com/blog/2016/07/deeper-regression-analysis-assumptions-plots-solutions/ Business AnalyticsMachine LearningGoing Dee...

2019-01-07 21:27:54 891

转载实战经验分享-少量数据NLP场景下进行深度学习训练的建议

摘自 lqfarmer 深度学习与NLPhttps://mp.weixin.qq.com/s/bGglLWd6dHcwXnX6Jqd3IA    作为数据科学家，最重要的技能之一应该是为你的问题选择正确的建模技术和算法。 几个月前，我试图解决文本分类问题，即分类哪些新闻文章与我的客户相关。    我只...

2019-01-06 10:50:19 1186

转载 a comprehensive guide for linear ridge and lasso regression

https://www.analyticsvidhya.com/blog/2017/06/a-comprehensive-guide-for-linear-ridge-and-lasso-regression/

2019-01-04 20:16:46 183

转载谈谈 Bias-Variance Tradeoff

摘自始终谈谈 Bias-Variance Tradeoff <span itemprop="articleBody"><blockquote>准确是两个概念。准是 bias 小，确是 variance 小。准确是相对概念，因为 bias-variance tradeoff。——Liam Huang在机器学习领域，人们总是希望使自己的模型尽可能准...

2019-01-03 14:07:52 631

原创如何处理小数据集线性回归问题

特征选择- 数据探查,分位数回归分析- Quantile Regression，传统统计分析数据与目标的关联；结合业务理解，选取特征去除异常点，和噪声限制模型的复杂度，防止过拟合，规则化L1， L2平滑化-模型多次运算结果取平均值或中值...

2019-01-03 10:02:17 1211

转载 NLP的巨人肩膀

NLP的巨人肩膀（上）许维https://mp.weixin.qq.com/s/Rd3-ypRYiJObi-e2JDeOjQNLP的巨人肩膀（下）许维https://mp.weixin.qq.com/s/7imMQ3GkD52xP7N4fqNPog

2018-12-29 15:50:43 235

原创 AI 资源及 blog

推荐一些比较优秀的AI资源：神经网络游乐场：https://playground.tensorflow.org/Gal Yona，在这个领域非常棒的博主之一。她的帖子包括从核心技术的解释到半哲学的评论。核心技术的解释：https://towardsdatascience.com/do-gans-really-model-the-true-data-distribution-or-are-...

2018-12-28 09:40:51 901

转载 DataFrame行列取数操作

摘自 http://bbs.fishc.com/thread-79821-1-1.htmlimport numpy as npimport pandas as pdfrom pandas import Sereis, DataFrameser = Series(np.arange(3.))data = DataFrame(np.arange(16).reshape(4,4),index=...

2018-12-27 13:55:30 668

转载 10 Exciting Ideas of 2018 in NLP

10 Exciting Ideas of 2018 in NLPSebastian Ruderhttp://ruder.io/10-exciting-ideas-of-2018-in-nlp/中文翻译机器之心编辑从想法到实干，2018年13项NLP绝美新研究https://mp.weixin.qq.com/s/HPN7RzmnvExCkcLUXCfr2g...

2018-12-26 17:37:24 315

原创 Prophet 时间序列预测

Prophethttps://facebook.github.io/prophet/docs/contributing.html中文https://blog.csdn.net/anshuai_aw1/article/details/83412058

2018-12-25 10:59:24 998

转载 seaborn 制图

摘自一闪一闪亮日日日日日https://www.jianshu.com/p/cce56332f80c

2018-12-21 10:16:09 278

转载换过很多工作，却依然无法在技术公司过好一生

技术人在职场需要的技术之外的技巧摘自 boxi TGO鲲鹏会https://mp.weixin.qq.com/s/iRRxvLaKUyG3FvI4l23lpw

2018-12-21 09:49:16 147

原创树叶子过河全靠那股子浪劲-代码参考

HKUST-KnowComphttps://github.com/HKUST-KnowComphttps://github.com/HKUST-KnowComp/R-Nethttps://github.com/HKUST-KnowComp/MnemonicReaderberthttps://github.com/google-research/bertAn open-source NL...

2018-12-21 09:37:40 654

转载机器学习之特征工程-数据预处理

摘自 jacksu在简书机器学习之特征工程-数据预处理https://www.jianshu.com/p/23b493d38b5b 通过特征提取，我们能得到未经处理的特征，这时的特征可能有以下问题：不属于同一量纲：即特征的规格不一样，不能够放在一起比较。无量纲化可以解决这一问题。信息冗余：对于某些定量特征，其包含的有效信息为区间划分，例如学...

2018-12-20 14:18:51 339

转载 stackingRegressor

stackingRegressorhttps://rasbt.github.io/mlxtend/user_guide/regressor/StackingRegressor/ &lt;div class="col-md-3"&gt;&lt;div class="bs-sidebar hidden-print affix well" role="complem

2018-12-19 16:02:54 1627

转载 StackingClassifier

摘自 mlxtendhttps://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/ <div class="col-md-3"><div class="bs-sidebar hidden-print affix well" role="complementary"><ul...

2018-12-19 15:57:24 1125

转载机器学习面试之Attention

摘自 milterhttps://www.jianshu.com/p/c94909b835d61 RNN做机器翻译的经典思路 encoder-decoder用RNN做机器翻译时，通常需要两个RNN网络，一个用来将接收待翻译语句，对其进行编码，最后输出一个vector，这个网络叫encoder。然后，该vector会作为输入，传给另一个RNN网络，该网络用来根据vector产生目标语言的翻译语...

2018-12-18 17:21:28 805

转载 The Annotated Transformer

The Annotated Transformer&lt;/a href=http://nlp.seas.harvard.edu/2018/04/03/attention.html &gt;&lt;header class="site-header"&gt; &lt;span&gt;&lt;img width="30px&

2018-12-18 14:16:10 1911

转载 The Illustrated Transformer

摘自 Jay Alammar https://jalammar.github.io/illustrated-transformer/ The Illustrated Transformer In the previous post, we looked at Attention – a ubiquitous method in modern deep learni...

2018-12-18 14:12:29 875

转载深度学习中的注意力模型（2017版）

摘自张俊林 https://zhuanlan.zhihu.com/p/37601161注意力模型最近几年在深度学习各个领域被广泛使用，无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中，都很容易遇到注意力模型的身影。所以，了解注意力机制的工作原理对于关注深度学习技术发展的技术人员来说有很大的必要。人类的视觉注意力从注意力模型的命名方式看，很明显其借鉴了人类的注意力机制，因此，我们首...

2018-12-18 14:09:54 1007

转载 ValueError: Input contains NaN, infinity or a value too large for dtype('float64')

摘自 Joy-comhttps://blog.csdn.net/u013764485/article/details/53012978问题：pandas在处理数据时出现以下错误ValueError: Input contains NaN, infinity or a value too large for dtype(‘float64’).解决方法：1、检查数据中是否有缺失值例如，读取...

2018-12-17 15:05:46 1236

转载 BERT相关论文、文章和代码资源汇总

摘自我爱自然语言处理 http://www.52nlp.cn/bert-paper-%E8%AE%BA%E6%96%87-%E6%96%87%E7%AB%A0-%E4%BB%A3%E7%A0%81%E8%B5%84%E6%BA%90%E6%B1%87%E6%80%BBBERT最近太火，蹭个热点，整理一下相关的资源，包括Paper, 代码和文章解读。1、Google官方:1) BERT: ...

2018-12-16 21:14:27 369

转载天空之城：拉马努金式思维训练法

摘自张俊林 https://zhuanlan.zhihu.com/p/51934140本文较长，我知道大概率你没有耐心读完，但是看完可能会让你在今后的日子里多年受益，所以还请保持一些耐心。如果只对机器学习技术方面感兴趣，可以直接跳到第四部分“空中建筑师：机器学习中的拉马努金式思维训练法”。如果你选择直接跳到了第四部分开始阅读，那么从这个行为推断，你肯定是典型的算法工程师，其实第五部分“出埃及记...

2018-12-14 10:58:10 1983

转载 XGBRegressor 参数调优

摘自大黄有故事 https://yq.aliyun.com/articles/572590这一篇博客的内容是在上一篇博客Scikit中的特征选择，XGboost进行回归预测，模型优化的实战的基础上进行调参优化的，所以在阅读本篇博客之前，请先移步看一下上一篇文章。我前面所做的工作基本都是关于特征选择的，这里我想写的是关于XGBoost参数调整的一些小经验。之前我在网站上也看到很多相关的内容，...

2018-12-12 20:17:12 49634 9

转载 LabelEncoder & OneHotEncoder

<摘自 http://biggyani.blogspot.com/2014/08/using-onehot-with-categorical.html>Using OneHot,LabelEncoder with categorical features/columns on a pandas dataframe, for feature selection and predicti...

2018-12-12 14:48:51 308

转载 SKlearn回归模型调包练习

摘自一只咸狗https://blog.csdn.net/u013982164/article/details/80364500 看了录播后照着代码敲了一遍 sklearn常用分类回归算法简介对能了解SKlearn常规套路，但模型具体的参数需要进一步了解。# 引入必要的第三方包from skl...

2018-12-11 15:47:36 727 1

转载几个常用算法的适应场景及其优缺点

转几个常用算法的适应场景及其优缺点（非常好）https://blog.csdn.net/u010159842/article/details/52918815 2016年10月25日 10:03:58 mishidemudong 阅读数：32162 ...

2018-12-11 13:54:03 812

转载使用回归分析，样本过少时不妨好先看看散点图

摘自刘重杰 https://cosx.org/2009/01/regression-with-graphics## 使用回归分析，样本过少时不妨好先看看散点图回归分析往往是学统计、学计量课程时接触的第一个统计模型了，甚至不少人可能认为回归分析理所当然成为计量的绝大部分内容——毕竟很多教材中提到统计模型的时候，往往就一个 OLS 为主的讲法。回归分析的内容当然很广泛，也在学科中占据相对基础的...

2018-12-11 10:05:48 5837

转载如何解决过拟合与欠拟合

转载自谷海燕 https://blog.csdn.net/zhuanzhe117/article/details/82595958 下面这张经典的图展示了欠拟合（第一个）与过拟合（第三个）。欠拟合模型在训练集上学习的不够好，经验误差大，称为欠拟合。模...

2018-12-08 13:57:56 248

转载使用sklearn做单机特征工程

使用sklearn做单机特征工程使用sklearn做单机特征工程目录1 特征工程是什么？2 数据预处理　　2.1 无量纲化　　　　2.1.1 标准化　　　　2.1.2 区间缩放法　　　　2.1.3 标准化与归一化的区别　　2.2 对定量特征二值化　　2.3 对定性特征哑编码　　2.4 缺失值计算　　2.5 数据变换　　2.6 回顾3 特...

2018-12-08 11:28:31 190 1