自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 资源 (3)
  • 收藏
  • 关注

转载 识别图片中文字的三种方法/图片转文字

识别图片中文字,图片转文字

2022-10-26 11:01:04 2952

转载 python单例模式

class Singleton(object): __instace = None __isInit = False def __new__(cls, *args, **kwargs): if not __instance: cls.__instace = super().__new__(cls) return cls._...

2021-12-13 19:24:58 608

原创 最长回文

#include <stdlib.h>int longestPalindrome(char *s){ int ret = 0; int lenstr = strlen(s); int num[26] = { 0 }; int flag = 0; for (int i = 0;i < lenstr;i++) { int j = s[i] - 97; num[j] = num[j] + 1; }...

2020-11-26 22:24:25 620

原创 2020-09-11

工作感悟:目前解bug比较多,工作中的bug解法也可以运用到生活中。每天其实都是解bug的过程,有的是小bug,很容易;有些是大bug,比较复杂,通过解决面临的每个bug,获得成就感和快乐。解bug可分为以下几步:1.复现。参考问题单,在本地复现问题。复现问题是第一步,也是很关键的一步,必须要清楚你的问题是什么,才能知道如何去解决问题,才能知道后续是不是解决了问题。2.沟通。针对问题单里不清楚的地方,及时与测试沟通。3.分析,猜测根据问题涉及到的具体业务,分析可能出问题的点,

2020-09-14 09:56:08 133

转载 TCP之nagle算法和延迟ACK

1.Nagle算法是为了减少广域网的小分组数目,从而减少网络拥塞的出现;该算法要求一个tcp连接上最多只能有一个未被确认的未完成的小分组,在该分组ack到达之前不能发送其他的小分组,tcp需要收集这些少量的分组,并在ack到来时以一个分组的方式发送出去;其中小分组的定义是小于MSS的任何分组;该算法的优越之处在于它是自适应的,确认到达的越快,数据也就发哦送的越快;而在希望减少微小分组数...

2018-12-20 09:33:42 472

原创 C语言柔性数组

C语言字符串数组,该数组作为结构体的成员之一,但由于是柔性数组,所以只能作为结构体的最后一个成员。结构体类型所占的空间不包括柔性数组。因为为结构体分配内存时要注意。例子如下:typedef struct Sys{  int a;  char* name[];}Sys;结构体的定义如上。当知道字符串数组要保存的字符串个数后,开辟空间,如下,数组大小为3:Sys...

2018-10-25 15:22:11 254

原创 linux网络编程入门

CSDN作者:Andoubi 原文链接:http://blog.csdn.net/andoubi/article/details/51778988 服务端代码 server.c #include&lt;stdio.h&gt; #include&lt;sys/socket.h&gt; #include&lt;string.h&gt; #include&lt;netinet/in.h&gt...

2018-08-01 19:10:03 266

原创 毕业论文,去掉页眉,页脚,页码,页眉里横线,分页符

前提是有分节符存在,Word 2003里插入分节符方式如下:查看是否有分节符方式:切换到普通视图,如下图:可以看到已经显示出分节符。接下来,正式开始去掉不该有的页眉和页脚,以及页眉里的横线。(页面视图下进行处理)先处理页眉,(已存在分节符)目前情况如下所示:去掉上图页眉,步骤如下:1.双击页眉,显示如下:取消“链接到前一条页眉”的选中状态;(保持光标不动)点击“页眉”-“删除页眉”,如下所示:此时...

2018-05-24 23:55:23 4102

转载 R,生成连续序列,生成重复序列,seq,rep

转自:https://book.2cto.com/201305/21949.html问题如何生成一个数列。解决方案使用表达式n:m生成简单数列n,n+1,n+2,...,m:&gt; 1:5[1] 1 2 3 4 5对于增量不为1的数列,可以使用seq函数:&gt; seq(from=1, to=5, by=2)[1] 1 3 5使用rep函数生成由一个数的重复所组成的数列:&gt; rep(1,...

2018-03-02 11:28:06 79134

原创 R里数字常规除法,整除,求余,取整,向上取整,向下取整,四舍五入

常规除法:   /&gt; 82/10[1] 8.2整除:    %/%&gt; 82%/%10[1] 8求余:    %%&gt; 82%%10[1] 2向下取整  floor()&gt; floor(8.9)[1] 8向上取整 ceiling()&gt; ceiling(8.1)[1] 9四舍五入取整 round()&gt; round(8.4)[1] 8&gt; round(...

2018-03-02 11:02:47 78152 2

转载 R,scale,归一化,反归一化

转自:http://bbs.pinggu.org/thread-4468874-1-1.htmlscale是减掉平均值再除以标准差;得到拟合数据之后,乘以标准差再加上平均值就可以了。例子:set.seed(1)x &lt;- runif(20)y &lt;- 2 * x + 0.1 * rnorm(20)plot(x, y)dat &lt;- data.frame(y, x)scaled.dat ...

2018-03-02 07:26:04 6139

转载 R语言:变量名称和字符串的转换

转自:https://www.cnblogs.com/awishfullyway/p/6601480.html在R语言中,经常会遇到变量名称和字符串相互转换的问题。比如说,进行1000次循环运算,并将运算结果存储在1000个变量中,如x_1, x_2, ... , x_1000。这时候可以使用assign()函数,示例如下:&gt; a错误: 找不到对象'a'&gt; assign('a', 1)...

2018-03-01 19:04:41 15739 1

转载 python安装包

转自http://blog.csdn.net/qq_35203425/article/details/78369219本人做机器学习,需要安装statsmodels、sklearn、matplotlib这些包,但是开始在python2.7环境下,matplotlib包安装后一直出现错误,可能是因为版本不对,接着转向python3.6.到python3.6环境下matplotlib包很好

2018-02-05 10:36:33 362

翻译 Scikit-learn 1.13.Feature selection

1.13.1 移除低方差的特征  VarianceThreshold方法布尔类型特征是Bernoulli随机变量,方差为:Var[X]=p(1-p)举例,阈值:.8*(1-.8)>>> from sklearn.feature_selection import VarianceThreshold>>> X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1]

2018-01-19 18:03:03 299

转载 互联网广告综述之点击率特征工程

转自:http://blog.csdn.net/dengxing1234/article/details/73499123互联网广告综述之点击率特征工程一.互联网广告特征工程博文《互联网广告综述之点击率系统》论述了互联网广告的点击率系统,可以看到,其中的logistic regression模型是比较简单而且实用的,其训练方法虽然有多种,但目标是一致的,训练结果对效果的

2018-01-09 21:46:03 643

转载 信息量,熵,相对熵,交叉熵

转自:http://blog.csdn.net/rtygbwwwerr/article/details/507780981.什么是信息量?假设X是一个离散型随机变量,其取值集合为X,概率分布函数为p(x)=Pr(X=x),x∈X,我们定义事件X=x0的信息量为:I(x0)=−log(p(x0)),可以理解为,一个事件发生的概率越大,则它所携带的信息量就越小,而当p(x0)=1时

2018-01-09 19:33:32 427

原创 关于xgboost

[译]快速上手:在R中使用XGBoost算法https://segmentfault.com/a/1190000004421821http://www.mamicode.com/info-detail-1700646.htmlR语言︱XGBoost极端梯度上升以及forecastxgb(预测)+xgboost(回归)双案例解读https://zhuanl

2017-12-07 18:08:08 292

转载 用XGBoost做时间序列预测—forecastxgb包

https://zhuanlan.zhihu.com/p/24236567作为forecast包与xgboost包的重度依赖者,最近看到整合两家之长的forecastxgb包甚是兴奋,便忍不住翻译forecastxgb包的一些时间序列预测例子与大家交流。一.安装目前forecastxgb包还在不断完善中,有兴趣的朋友可以通过以下语句下载试用:devtools::in

2017-12-07 14:49:37 3916 1

转载 R中利用apply、tapply、lapply、sapply、mapply、table等函数进行分组统计

http://blog.sina.com.cn/s/blog_6caea8bf0100xkpg.htmlapply函数(对一个数组按行或者按列进行计算):使用格式为:apply(X, MARGIN, FUN,...)其中X为一个数组;MARGIN为一个向量(表示要将函数FUN应用到X的行还是列),若为1表示取行,为2表示取列,为c(1,2)表示行、列都计算。示例

2017-12-07 11:13:10 699

转载 集成算法系列之GBM

http://baijiahao.baidu.com/s?id=1570175598042474&wfr=spider&for=pc一、GBM简介GBM全称为Gradient Boosting Machine,是Boosting算法的一种。Boosting算法详见《集成算法系列之初识》。GBM主要思想是基于之前建立的基学习器的损失函数的梯度下降方向来建立下一个新的基学习器,目的就是希望

2017-12-07 10:20:21 4317

转载 高斯过程回归详解

https://mp.weixin.qq.com/s/Ct9en9jzmX3d4JCFb4Fc3g

2017-12-04 13:27:15 12813

转载 R语言数据导出

1、导出文本文件1)write.table函数语法:write.table (x, file ="", sep ="", row.names =TRUE, col.names =TRUE, quote =TRUE)x:需要导出的数据file:导出的文件路径sep:分隔符,默认为空格(" "),也就是以空格为分割列row

2017-11-23 13:24:48 6012

转载 分解时间序列(季节性数据)

一个季节性时间序列中会包含三部分,趋势部分、季节性部分和无规则部分。分解时间序列就是要把时间序列分解成这三部分,然后进行估计。对于可以使用相加模型进行描述的时间序列中的趋势部分和季节性部分,我们可以使用 R中的“decompose()” 函数来估计。这个函数可以估计出时间序列中趋势的、季节性的和不规则的部分,而此时间序列须是可以用相加模型描述的。  “decom

2017-11-20 20:02:22 26408 1

原创 时间序列分析记录一

datasales<-read.table(file="e:/rdata/OneBigClass.csv",header = TRUE,sep=",")dim(datasales)names(datasales)<-c("Year","Month","Day","Count")data<-datasales$CountrollingN(data)tsdata<-ts(rldata)ts

2017-11-15 11:23:25 835

转载 R计算移动平均的方法

移动平均可以使时间序列变平滑,是典型的有序计算问题,其基本算法是:将N个连续的时间序列成员作为一个集合,计算该集合的平均值,并逐项推移该集合。下面用一个例子来说明R计算移动平均的方法。移动平均可以使时间序列变平滑,是典型的有序计算问题,其基本算法是:将N个连续的时间序列成员作为一个集合,计算该集合的平均值,并逐项推移该集合。下面用一个例子来说明R计算移动平均

2017-11-14 20:40:54 13812

转载 你所不知道的Python奇技淫巧

有时候你会看到很Cool的Python代码,你惊讶于它的简洁,它的优雅,你不由自主地赞叹:竟然还能这样写。其实,这些优雅的代码都要归功于Python的特性,只要你能掌握这些Pythonic的技巧,你一样可以写出像诗一样的Python代码。1.导入模块你是不是经常对调用模块时输入一长串模块索引感到头疼?说实在的,数量少的时候或许还可以勉强忍受,一旦程序规模上去了,这也是一项不

2017-10-12 16:30:43 296

转载 k-means+python︱scikit-learn中的KMeans聚类实现( + MiniBatchKMeans)

来源“素质云博客”之前一直用R,现在开始学python之后就来尝试用Python来实现Kmeans。 之前用R来实现kmeans的博客:笔记︱多种常见聚类模型以及分群质量评估(聚类注意事项、使用技巧)聚类分析在客户细分中极为重要。有三类比较常见的聚类模型,K-mean聚类、层次(系统)聚类、最大期望EM算法。在聚类模型建立过程中,一个比较关键的问题是如何评价聚类结果

2017-10-12 16:27:52 7750

转载 Python 列表生成式(List Comprehensions)

转自http://blog.csdn.net/yizheyouye/article/details/50638895列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。举个例子,要生成list [1,2,3,4,5,6,7,8,9,10]可以用list(range(1, 11)):>>> list(r

2017-10-07 15:22:03 548

转载 Numpy 入门教程

转自http://blog.csdn.net/liyuanbhu/article/details/28611429转自http://blog.csdn.net/liyuanbhu/article/details/28870439翻译自官方文档Tentative NumPy Tutorial,有删节。Numpy 入门教程NumPy 提供了对多维数组的支持,与Pyt

2017-10-07 15:19:13 324

转载 Python中的Numpy入门教程

导入numpy,numpy.array方法,指定数据类型dtype=np.int32,numpy.arange方法,numpy.linspace方法,numpy.zeros,numpy.ones,numpy.eye等方法,获取数组的属性a.ndim #数组的维数,a.shape #数组每一维的大小, a.size #数组的元素数, a.dtype #元素类型,a.itemsize #每个元素所占的字节数,数组索引,切片,赋值,使用for操作元素。基本的数组运算,构造,加减乘除,自带的方法,

2017-10-07 15:11:41 317

转载 numpy 常用操作

创建数组np.array,变形shape,拉直ravel,随机生成np.random.randn(2,3),拼接np.vstack,np.hstack,对应元素相乘A * B,矩阵乘法np.dot(A, B) # 或者 A.dot(B),转置A.transpose(),逆矩阵 linalg.inv(A),# 特征值和特征向量eigenvalues, eigenvectors = linalg.eig(A)

2017-10-07 14:38:44 364

转载 python numpy 基础教程

Numpy简单介绍1.Numpy是什么很简单,Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy、matplotlib一起使用。其实,list已经提供了类似于矩阵的表示形式,不过numpy为我们提供了更多的函数。如果接触过matlab、scilab,那么numpy很好入手。 在以下的代码示例中,总是先导入了numpy:(通用做法import numpu a

2017-10-07 14:33:02 334

转载 python中matplotlib的颜色及线条控制

转载请注明出处:http://www.cnblogs.com/darkknightzh/p/6117528.html参考网址:http://stackoverflow.com/questions/22408237/named-colors-in-matplotlibhttp://stackoverflow.com/questions/8409095/matplotl

2017-10-02 17:32:13 1088

转载 Python数据分析之pandas学习

Python中的pandas模块进行数据分析。接下来pandas介绍中将学习到如下8块内容:1、数据结构简介:DataFrame和Series2、数据索引index3、利用pandas查询数据4、利用pandas的DataFrames进行统计分析5、利用pandas实现SQL操作6、利用pandas进行缺失值的处理7、利用pandas实现Excel的数据透视表功

2017-09-30 16:58:11 508

转载 sklearn中聚类(部分)

下图为主要介绍的几个聚类方法:1、 k均值(K-means)▲在指定n个类别后,最小化类别中样本到类别均值样本的距离,公式如下:其中,Ci为划分,ui为每个划分的均值向量,k=n。K-均值是相当于一个小、 全等、 对角协方差矩阵的期望最大化算法。▲该方法有以下缺点:有个前提:集群是凸和各向同性的。对长条形、流行以及不规则形的集群响应不好。

2017-09-30 09:24:27 4048

转载 报错 ImportError: No module named model_selection 的解决办法

win10下运行了一段Python代码,出现了报错, 报错是ImportError: No module named model_selection。我定位代码到import sklearn.model_selection,我才知道原来我没有这个model。我在网上找了一下解决方法,原来是scikit-learn的版本太低。在anaconda中通过命令行查看sklearn的版本为 0.17

2017-09-28 08:53:10 1673

转载 推荐算法

所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。推荐算法主要分为6种。基于内容基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。主要是从两个方法来描述基于内容的推荐方法:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计

2017-09-28 07:55:19 1146

转载 sigmoid函数求导与自然指数

在神经网络里经常使用sigmoid做激活函数,它的导数是怎么样求解呢?因为要使用它的导数来计算梯度下降。这个过程如下:1. sigmoid函数:f(z) = 1 / (1 + exp( − z))导数:f(z)' = f(z)(1 − f(z))求导过程如下:下文解释e的来由:https://bettere

2017-09-27 20:31:12 511

转载 BP神经网络,BP推导过程,反向传播算法,误差反向传播,梯度下降,权值阈值更新推导,隐含层权重更新公式

一、BP神经网络的概念BP神经网络是一种多层的前馈神经网络,其主要的特点是:信号是前向传播的,而误差是反向传播的。具体来说,对于如下的只含一个隐层的神经网络模型:(三层BP神经网络模型)BP神经网络的过程主要分为两个阶段,第一阶段是信号的前向传播,从输入层经过隐含层,最后到达输出层;第二阶段是误差的反向传播,从输出层到隐含层,最后到输入层,依次调节隐含层到输出层的权重和偏置,输

2017-09-27 20:09:51 39564 6

转载 用scikit-learn和pandas学习线性回归

来源:刘建平Pinardhttp://www.cnblogs.com/pinard/p/6016029.html对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。1. 获取数据,定义问题    没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器

2017-09-27 08:02:44 711 1

误差分析计算公式和对应的matlab实现

误差分析计算公式及matlab代码实现(均方误差MSE,平均绝对误差MAE,平均绝对百分比误差MAPE,均方百分比误差MSPE,均方根误差RMSE,残差平方和SSE)

2017-03-05

误差分析计算公式及matlab代码实现(基础公式)

误差分析计算公式及matlab代码实现(均方误差MSE,平均绝对误差MAE,平均绝对百分比误差MAPE,均方百分比误差MSPE,均方根误差RMSE,残差平方和SSE)

2016-10-10

有关JSP实训的基本操作

自己的一点心得,如果你想用JSP开发程序,而又不知如何下手时,可以看看我的心得,也有关于数据库,myeclipse等

2015-04-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除