作为一名量化从业人员,平时经常会被其它行业的人问到什么是量化投资?量化策略是如何交易股票的?
其实这个问题没有一个标准答案,以笔者的从业经验,一个量化策略通常具备三个要素:数据、规则和历史回测。
下面以经典的多因子选股模型为例对这三个要素分别进行说明。
要素一:数据
如果问起量化策略最基础的是什么?答案必然是数据。
俗话说“巧妇难为无米之炊“,数据是搭建量化策略的最原始材料。对于投资而言,无论是主观还是量化,我们在做决策时必须要有合理的依据,比如我们看到生活中的某些现象,认为它可能会对A公司未来的业绩产生正面的影响,从而驱使我们买入A公司的股票。量化策略的依据通常是能够抽象成具体数字的数据,这些数据应该被证明和未来股票价格的走势有一定的相关性。
如果我们想要从全市场4000多只股票中选出10只未来1个月收益潜力最大的,那么就免不了对这些股票做一些比较。就好比我们在选拔篮球运动员时首先会比较候选者的身高一样,我们希望能够有一个统一的指标对这些股票进行有效的筛选,这样的指标被称为“选股因子“,它的本质是对股票未来的相对收益进行预测。
目前A股市场中常用的几类选股因子包括估值因子、成长因子、质量因子、分析师预期因子、技术面因子等。
因为这些因子是用来对公司进行比较,所以通常具有统一的“量纲”,比如不同公司的ROE(净资产回报率)水平相比于净利润的绝对值可能更加具备可比性。另外,因子其实是原始数据加工后的产物,比如财务比率来自于财务报表,技术因子来自股票价格和成交量等等。不同因子的预测效力不同,好的策略需要纳入和未来股价表现相关性尽可能高的因子,如何从原始数据出发合成有效因子是量化研究中的最重要的环节之一。
要素二:规则
各种原始数据准备完毕之后,我们接下来要将它们加工成投资决策。这个过程分三步完成。
第一步需要对投资目标进行定量化描述。例如在4000只股票中买入10只股票并持有1个月,使得组合的夏普比率尽可能高。在这个问题里面,我们需要确定4000个参数,即每只股票的权重值,它是一个介于0到1之间的数值(0代表这只股票没有入选),且所有股票的权重之和等于1。
第二步需要建立从原始数据到股票仓位之间的映射关系。之前我们已经准备了一些选股因子对股票未来的收益进行预测,以低估值因子为例,我们可以参考历史数据中低估值股票的表现对当前低估值股票未来的表现进行预测,其它因子类似,多个维度的因子综合起来之后能够提高预测的准确性。对于股票权重的确定,直觉上好像应该给未来收益预测较高的股票更高的权重,但是股票的收益存在不确定性,最终的优化结果取决于我们想要达到的风险收益目标。
第三步就是把之前的规则用程序自动化。量化模型的输入是数据库中的各种数据,中间经过电脑程序对策略规则的实现,最终输出结果是每只股票的建议仓位。一旦策略写好,中间的实现过程就不再有人工干预。
要素三:历史回测
具备了前面两个要素,其实就有了量化策略的雏形,接下来的问题是如何评价一个策略的好坏。一个最直接的办法就是将这套规则应用在历史数据上,例如看看过去五年时间这个策略是否能够达成既定的收益目标,这个环节就是量化研究中的历史回测。通过分析回测结果我们可以对策略的胜率、赔率以及收益分布有更加直观的认识。
从这里可以看出量化策略的特点是归纳和总结历史规律,而不会对历史上没有发生过的事情进行推演,这既是缺点也是优点。缺点在于如果支撑历史规律背后的市场范式发生大的改变,那么基于历史数据的策略评价结果也就失去了参考价值。而优点在于策略能够克服人性的弱点,一直在坚持做历史上“大概率对”的事情,符合我们常说的“以史为鉴”。
免责声明:本文件中的内容及观点仅供参考,不构成对投资者的任何投资建议。以上观点、意见,仅为对宏观经济政策、相关行业发展动态等相关问题的看法,西部利得基金管理有限公司(以下简称“本公司”)或本公司的相关部门、雇员不对任何人使用文件中内容而引致的任何损失承担责任。本公司在本文件中的所有观点仅为本文件成文时的观点,有权对其进行调整。本文转载或引用的第三方报告或资料,仅代表该第三方观点,并不代表本公司的立场,本公司不对其真实性、准确性或完整性提供直接或隐含的声明或保证。除非另有说明,本文件的著作权为西部利得基金管理有限公司所有。未经本公司的事先书面许可,任何个人或机构不得将此文件或任何部分以任何形式进行复制、修改、发布、转载,或对本文件内容进行任何有悖原意的删节或修改。基金有风险,投资须谨慎。
- 西部利得量化价值一年持有期混合(011849)
- 西部利得国企红利(LOF)A(501059)
- 西部利得中证500指数增强A(502000)
本文作者可以追加内容哦 !