一、目的
本文采用Apriori算法[1]研究基金评级和基金涨幅的关联关系。目的是研究基金的评级高是否意味着收益高?
二、数据和思路
数据来源于天天基金网。
基金评级选用招商评级。招商评级分为1星、2星、3星、4星、5星,本文分别采用1.0,2.0,3.0,4.0,5.0代表,数字越大,评级越高。
基金涨幅按照业绩排名分为四组,分别为优、良、中、差,各占四分之一。
基金选用股票占比等级5[2]的股票型、混合型基金。这些基金间的业绩具有可比性。
主要观察基金在评级为5星的情况下,业绩为优的概率。若概率大,则意味评级高、收益率高;否则高评级不一定带来高收益。
三、概念
为了方便理解,先简单介绍两个概念。
置信度表示在前件出现的情况下,后件出现的概率。如在顾客买烟(前件)的前提下,买火柴(后件)的概率。置信度越高,规则的可靠性越强。
提升度可理解为前件的出现对后件的影响。如顾客买烟前提下买火柴的概率要高于单独买火柴的概率。提升度大于1,表示前件(买烟)对后件(买火柴)起促进作用;否则起抑制作用。
四、正文
首先观察2020年的结果,如下图。
图中观察可知:
[‘5.0’]→[‘优’]的置信度0.59,意味着在评级5星的基金中,有59%基金的业绩为优(业绩排名前四分之一)。
[‘5.0’]→[‘优’]的提升度远大于1,意味着评级5星对基金业绩优起到促进作用,在5星基金中挑选业绩优的基金比在所有基金中要更容易。
为了保证结论的可靠性,再来看看其他年份是否如此?
从上面的组图中可知,2015-2019年亦如此。所以我们的结论是可靠的。
五、结论及建议
评级高的基金更容易取得相对高收益。在选择基金的过程中,评级可以作为一个重要的参考指标。
本文的结论同时也为我们《基金实战1-5》中筛选基金的方法提供了可靠佐证。
六、补充
本文仅研究了评级与涨幅的关系,未来有机会我们还会探索研究“机构持有比例”、“内部持有比例”等其他指标及这些指标综合起来与基金涨幅的关联关系。
本人对Apriori算法了解有限,如有不当之处,还请大家斧正。
最后,水平有限,真心希望能得到金融专业机构和人士指点和帮助!
[1] Apriori算法是第一个关联规则挖掘算法,也是最经典的算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉那些没必要的中间结果)组成。该算法中项集的概念即为项的集合。包含K个项的集合为k项集。项集出现的频率是包含项集的事务数,称为项集的频率。如果某项集满足最小支持度,则称它为频繁项集。(来源百度)
[2] 股票占比等级5是指股票占基金资产的比例超过80%。
================
- 富国天益价值混合A(100020)
- 工银丰盈回报灵活配置混合A(001320)
- 易方达改革红利混合(001076)
本文作者可以追加内容哦 !