一、目的

本文采用Apriori算法[1]研究基金评级和基金涨幅的关联关系。目的是研究基金的评级高是否意味着收益高?

二、数据和思路

数据来源于天天基金网。

基金评级选用招商评级。招商评级分为1星、2星、3星、4星、5星,本文分别采用1.0,2.0,3.0,4.0,5.0代表,数字越大,评级越高。

基金涨幅按照业绩排名分为四组,分别为优、良、中、差,各占四分之一。

基金选用股票占比等级5[2]的股票型、混合型基金。这些基金间的业绩具有可比性。

主要观察基金在评级为5星的情况下,业绩为优的概率。若概率大,则意味评级高、收益率高;否则高评级不一定带来高收益。

三、概念

为了方便理解,先简单介绍两个概念。

置信度表示在前件出现的情况下,后件出现的概率。如在顾客买烟(前件)的前提下,买火柴(后件)的概率。置信度越高,规则的可靠性越强。

提升度可理解为前件的出现对后件的影响。如顾客买烟前提下买火柴的概率要高于单独买火柴的概率。提升度大于1,表示前件(买烟)对后件(买火柴)起促进作用;否则起抑制作用。

四、正文

首先观察2020年的结果,如下图。

图中观察可知:

[‘5.0’]→[‘优’]的置信度0.59,意味着在评级5星的基金中,有59%基金的业绩为优(业绩排名前四分之一)。

[‘5.0’]→[‘优’]的提升度远大于1,意味着评级5星对基金业绩优起到促进作用,在5星基金中挑选业绩优的基金比在所有基金中要更容易。

为了保证结论的可靠性,再来看看其他年份是否如此?

从上面的组图中可知,2015-2019年亦如此。所以我们的结论是可靠的。

五、结论及建议

评级高的基金更容易取得相对高收益。在选择基金的过程中,评级可以作为一个重要的参考指标。

本文的结论同时也为我们《基金实战1-5》中筛选基金的方法提供了可靠佐证。

六、补充

本文仅研究了评级与涨幅的关系,未来有机会我们还会探索研究“机构持有比例”、“内部持有比例”等其他指标及这些指标综合起来与基金涨幅的关联关系。

本人对Apriori算法了解有限,如有不当之处,还请大家斧正。

最后,水平有限,真心希望能得到金融专业机构和人士指点和帮助!



[1] Apriori算法是第一个关联规则挖掘算法,也是最经典的算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉那些没必要的中间结果)组成。该算法中项集的概念即为项的集合。包含K个项的集合为k项集。项集出现的频率是包含项集的事务数,称为项集的频率。如果某项集满足最小支持度,则称它为频繁项集。(来源百度)

[2] 股票占比等级5是指股票占基金资产的比例超过80%。

================

基金实战1——组合展示

基金实战2——这样的平均收益率,你能否接受?

基金实战3——实现平均收益率

基金实战4——基金总体的均值和方差

基金实战5——提高平均收益率

相关证券:
  • 富国天益价值混合A(100020)
  • 工银丰盈回报灵活配置混合A(001320)
  • 易方达改革红利混合(001076)
追加内容

本文作者可以追加内容哦 !