自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 岭回归个人笔记

岭回归的原理解释

2023-09-14 14:32:46 472 2

原创 聚类分析个人笔记(未完)

喵喵喵

2023-04-27 16:21:04 1705

原创 如何用SPSS做logistic回归

详细到只有作者本人能看懂的SPSS逻辑回归育儿经

2023-04-13 23:03:30 17039 6

转载 最小二乘法和梯度下降算法的区别

爱丽丝的开发框架

2022-12-02 22:36:44 278

原创 吴恩达神经网络(2)

哇卡哇卡黑一黑

2022-11-30 22:42:37 288 1

原创 吴恩达神经网络(1)

(*^▽^*)

2022-09-06 11:59:41 240

原创 在解决分类问题时,为何不用传统线性回归模型,而要用logistic模型

胡言乱语

2022-08-22 23:39:00 1236

原创 过拟合问题

喵喵喵

2022-08-19 17:53:56 310

原创 与梯度下降算法相比的先进算法

喵喵喵

2022-08-12 17:34:10 620

原创 FA和PCA的区别

之前我以为主成分分析用协方差矩阵→散度矩阵,而fa用相关系数矩阵,这也是区别之一。但事实上先对数据进行标准化后,其协方差矩阵就是相关系数矩阵(忘了在哪看的了)。还有一点,fa的因子载荷矩阵是特征值开根号*特征向量,而pca的好像没开根号?继续学习了一下,大致可以认为,主成分分析是因子分析的前半部分。具体可见参考文献1:重点看文献1中关于两种分析方式的步骤,以及对于差异的总结。Fa就是在pca的基础上又做了因子旋转,因为pca所得出的几个主成分是不具有明确的现实意义的,只能说是几个主要成分的混合。而因

2022-04-07 18:58:06 498

原创 A/B测试

文献1文献2一、作用和目的1.比较何者更好2.计算收益:如ROI二、实验步骤1.选取指标可分为核心判定指标,辅助观察指标,以及否决指标。2.流量分配总结以上三种,其实可以认为影响大的就要用小流量作为实验组,影响小的就可以均匀分组(理论上均匀分组是最好的),而第三种情况,一般来说像促销活动不会有负面的影响,所以可以在均匀的基础上更激进一点,只留小部分无活动流量作为对照组。我其实不太明白流量分配和试验速度之间的关系。→第一篇文献中接下来有讲到,例如我们需要20w的样本,但每天只有5w用

2022-03-23 20:11:09 70

原创 四个模型与指标体系的建立

参考文献:文献1文献2一、OSM模型OSM模型是 Object, Strategy, Measure的缩写。Object可以理解为核心目标,KPI,对应指标体系中的一级指标。Strategy就是为了达到核心目标而采取的行动策略,Measure就是评估指标。二、两种路径模型1.AARRR模型(海盗法则)AARRR是从产品角度出发,揭示产品的生命周期。包括拉新、促活、留存、付费、推广。2.UJM模型(User Journey Map)UJM是从用户角度出发,揭示用户的行为路径。即用户注册,登陆,

2022-03-12 19:36:29 2242

原创 指标体系的建立

参考文献:文献1文献2一、指标体系的作用1.建立用户量化衡量的标准2.减少重复工作,提高分析效率3.帮助快速定位问题二、常见的指标1.用户数据指标:如日新增用户数、活跃率(DAU、MAU)、留存率2.行为数据指标:PV(访问次数,page view)、UV(访问人数,unique visitor)、转发率、转化率3.产品数据指标:总量类(如总观看时长、成交总额,即GMV)、人均类、付费率三、指标体系的建立一级指标也就是核心指标,如脸书的月活、喜马拉雅的用户收听时长等(当然核心指标可以

2022-03-11 21:58:32 482

原创 漏斗分析法个人笔记

参考文献:文献1文献2漏斗分析是什么:展现用户行为步骤以及各步骤之间的转化率漏斗分析的关键要素和步骤:四大要素:研究对象、时间、节点、指标步骤:明确研究对象→确定事件开始和结束的时间→拆解用户路径,明确关键节点,从而明确漏斗的各个步骤→确定(建立)指标(体系),指导关键节点优化漏斗分析法的应用场景实操:见两篇文章...

2022-03-09 19:09:05 191

原创 因子分析python实操

参考文章:https://blog.csdn.net/qq_41081716/article/details/1033324721.kmo检验和bartlett球形检验#因子分析df2 = data.iloc[:,[364,365,366,367,368,369,370,371]]df2 = df2.astype(float) #df2的dtype是object,如果不转成float,相关系数矩阵是出不来的df2_corr = df2.corr()print("\n相关系数:\n",df2_c

2021-04-21 19:09:45 730

原创 因子分析个人笔记

首先,最棒的参考文献是这篇:文献然后我们结合多篇文章来讲一讲:第一部分X是原始数据的矩阵,f是公共因子,也就是之后想要提取出来的因子,而特殊因子就是不去考虑的部分。那么,什么是因子载荷矩阵?百度百科:因子载荷 aij 的统计意义就是第i个变量与第 j 个公共因子的相关系数即表示 Xi 依赖 Fj 的份量(比重)。统计学术语称作权,心理学家将它叫做载荷,即表示第 i 个变量在第 j 个公共因子上的负荷,它反映了第 i 个变量在第 j 个公共因子上的相对重要性。基于此我们得到:1.第一行的元素分别

2021-04-15 22:25:15 7697

原创 主成分分析法的一些笔记和理解(不断更新中)

主成分分析法的一些笔记和理解(不断更新中)参考的是:https://microstrong.blog.csdn.net/article/details/806327791.对原文章3.1的解读PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标

2021-04-15 22:24:39 576

原创 关于DataFrame按条件删选行的一些探索

参考https://blog.csdn.net/weixin_41843918/article/details/88621893data = {"价格":[10,20,40,60,10],"销量":[100,62,42,25,120]}data = pd.DataFrame(data)#情形一:print(data.loc[data["价格"] == 10])结果为: 价格 销量0 10 100 4 10 120 若是不想将整行都print出来,则可以改成:

2021-03-24 17:11:06 164

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除