wbbhcb-CSDN博客

原创特征重要性计算方法及神经网络的特征重要性

这是我第63篇文章。这篇文章主要简单讲一些常用特征重要性计算方法及神经网络的特征重要性计算方法。1 几种常用的特征重要性计算方法1.1 树模型特征重要性像xgboost、lightgbm等树模型都有自己计算特征重要性的方法，其特征重要性与特征使用次数和使用特征时带来的增益有关系。增益可以理解为对Loss带来的提升，或与之相类似的指标。基本上特征被用来分裂的次数越多，分裂后带来的增益越大该特征也就越重要。具体特征重要细节大家可以自行网上搜索，或者看这篇文章：https://zhuanlan.zhihu

2022-05-07 17:03:33 6238

原创指数增强策略的背后

工作之后，一有空闲的时间就想玩想休息，今天抽空写了篇关于指数增强的文章。1. 什么是指数？相信有过一段时间股票投资经验的朋友们都知道什么叫做指数，股票指数具体计算规则比较复杂，其涨跌的幅度主要是根据一些股票的涨跌幅度加权得到的。不同的指数涨跌是由不同的股票集合的涨跌加权计算得到的，而这个股票集也是会不断更新的。A股市场常见的指数有上证指数、深证成指、沪深300和中证500等。不同指数所反应的也是不同的股票集，沪深300的涨跌反应了大市值股票的涨跌，而中证500的涨跌则反应了中小市值股票的涨跌。2.

2022-05-07 17:01:23 1084

原创量化建模时常见的数据穿越问题

这篇文章将会介绍一下量化建模时常见的数据穿越问题。何为数据穿越？对于t时刻训练得到的模型必须用t时刻之前的数据训练，如果t时刻用到t时刻以后的数据则会产生数据穿越问题。我碰到比较多的数据穿越问题主要有三种：1.训练集和测试集有交叉；2. 特征穿越；3. 数据筛选穿越。1. 训练集和测试集有交叉即训练集中混入了部分测试集。排除代码写错的情况下，有时候也会很容易犯这种错误。那为什么会出现这种情况的？举个例子，我的预测目标为20天后的收益率。回测时，我每30天滚动训练一次模型。假设一开始的训练集是从第1天

2022-05-07 16:57:08 1727 2

原创深度剖析为何选取相关性系数评价因子

这篇文章将会结合理论深度剖析为何选取相关性系数作为评价因子有效性的指标之一，以及结合中国期货市场分析不同情况下的因子相关性的最低要求。在因子投资策略中，经常会选取某因子或合成因子排名靠前的股票投资，那如何评价因子的有效性呢？一个最常用的评价指标就是IC（information correlation），也就是皮尔逊相关性系数。假设y是因子的取值，x是下一个周期的收益率，那么因子的IC计算公式如下：其中D(x)表示x的方差。在查看一些资料中，经常会看到一个因子如果IC值大于0.03，那么这个因子可以称

2020-11-22 10:29:56 1905

原创时间序列问题上的可解释机器学习的benchmark方法

今天这篇文章介绍一篇机器学习可解释的文章，该篇文章主要提出了一种时间序列问题上的机器学习可解释方法的benchmark。文章链接：https://arxiv.org/abs/2010.13924虽然目前可解释方法研究不成熟，但本篇文章我个人觉得还是比较有意思的，值得一看。由于本人在可解释机器学习上积累不多，文章读起来有些吃力，文章中对目前一些可解释方法的分析部分比较难理解（很多地方我也是带着猜测理解的），但文章的核心方法很好理解。后文将会介绍本人对这篇文章的理解，可能会与原文内容有所偏差，敬请谅解。

2020-11-22 10:26:59 1939

原创基于深度学习的股票超短策略

我花了点时间写了个利用神经网络模型的选股策略供大家学习参考使用。股票的策略思路还是超短策略，具体就是当天尾盘买入，第二天尾盘卖出。我之前也曾用lgb做过类似的策略，具体可以看（送你一份年化100%+的策略）。对于机器学习任务的流程不熟悉的朋友可以网上找资料，也可以看（利用机器学习从0到1开发量化选股策略）。这篇文章中我把lgb换成了神经网络模型。本篇文章分为5部分，分别是: 1. 数据准备；2. 特征构建，标签的制作；3. 特征标准化；4. 模型构造及训练；5. 回测。1. 数据准备使用的数据是tu

2020-11-22 10:20:08 1945

原创期货ML策略（三）基于交易信号的回测

接上一篇文章（期货ML策略（二）构建机器学习模型），这篇文章开始对上一篇的结果进行回测分析。上一篇文章中我简单的介绍了如何构建ML模型。当在实盘的时候，每隔一分钟我们可以获取到不同合约的实时数据（1分钟k线数据），然后构造需要的特征并将其输入模型中。模型会根据输入的特征输出20分钟后上涨概率，当达到预先设定的阈值时对其做多或做空。在回测的过程中，为了加快回测的速度，我们只需要提前计算好在何时买入，何时卖出即可。考虑到当获得K线数据之后不能马上给出交易信号，并且存在一些时间差，所以回测的时候延后1分钟交易

2020-06-24 19:56:00 2193 1

原创期货ML策略（二）构建机器学习模型

接上一篇文章（期货ML策略(一)数据获取），这篇文章开始构建机器学习模型。如何构建一个机器学习模型，其最本质还是要看你需要机器学习为你做什么贡献。我这边希望能够利用机器学习帮助我预测未来一段时间上涨还是下跌，这样我就可以对应进行做多或者做空。太高频的策略一般会比较耗费手续费，太低频的策略又容易出现很多意想不到的巨额损失，因此需要设置一个合理的预测时间，这个时间我设置的是20分钟（期货是T+0操作）。通过模型预测20分钟后的涨跌情况，策略进行相应的做多或做空（有点像我之前的超短策略）。训练一个传统的机器学

2020-06-24 19:53:53 2080

原创期货ML策略(一)数据获取

最近要开始研究期货上的机器学习（Machine Learning）策略了。相信关注我的朋友已经多多少少知道一些有关机器学习的基础知识了，对于机器学习的基础知识我这边不会介绍，只会简单的提一下，不懂的朋友自行网上搜索资料学习。未来一段时间里，我将会利用所学的知识开发一个期货上的ML策略。策略思路如下：交易时间内每分钟从主力合约（可以理解为交易活跃的股票）中选取未来几分钟内极大可能有较大的涨幅或跌幅的合约，对他们进行做多或做空。非常像我之前做的股票策略一样，挑一只未来很大可能上涨的股票对它进行买入操作(送你一

2020-06-24 19:50:13 1810 1

原创对于CNN应用的一些思考及一些讨论社区推荐

周五我抽空又尝试了一下基于CNN的选股方案，效果也不太好，就不放上来了。于是我想看看其他人实现的比较好的结果。然后我发现了其实很多量化策略平台都有自己的交流社区，交流社区上会有一些方案、研报和基础知识分享。如下图：有需要的朋友可以收藏以下链接：Bigquant社区：https://bigquant.com/community/Ricequant社区：https://www.ricequant.com/community/category/allJoinquant社区：https://www.joi

2020-06-24 19:41:58 518

原创大盘涨跌预测及仓位控制思考

今天分享一篇个人在大盘涨跌上的预测及通过涨跌预测延伸的仓位控制思考。大盘的择时个人一直认为是股票量化中最重要的部分（普通的策略）。一个好的择时方法，虽然可能会让部分盈利变少，但能够大大的降低回撤。很多策略虽然有很高的收益，但其回撤也是巨大的。基本上越有钱的人越看重策略的回撤，可以说如果一个策略的回撤超过10%都不算好的策略，当然有些人可能要求更高。如何进行大盘择时呢？一个很简单的想法就是预测大盘的涨跌。尤其是超短策略，能够预测出第二天的涨跌对超短策略能有很大的帮助（我这里所说的超短策略主要是指：送你一份

2020-06-24 19:40:02 1918

原创从图形角度利用神经网络进行选股

做了一个很low的基于神经网络的选股策略，回测效果惨淡，仅供大家学习使用，带大家入门深度学习。问题转化与模型选择首先对于选股这个问题，如果要利用神经网络的话，需要将其转化为有监督学习问题，一般情况下都是转化为有监督学习问题。有监督问题可以分为分类与回归问题。这里我将其转化为二分类问题，即预测第二天是否上涨，建模方式与之前文章相同（送你一份年化100%+的策略）。当然也可以分成多个类别，表示不同程度的涨幅或跌幅。如果用神经网络的话，目前一般会设计基于CNN的模型或基于LSTM的模型。这里我选择了CNN进

2020-06-24 19:38:11 931

空空如也

空空如也