基金仓位研究百家争鸣
标杆监测模型未来难觅
作为A股市场中最重要的机构投资者之一,公募基金尤其是主动管理型股票基金的一举一动向来为各方所关注。
近日,继银河证券、民生证券两家券商对基金仓位测算发表了完全不同的看法后,市场引起了热议,基金仓位测算也随即成为近期的焦点话题之一。
众所周知,目前公募基金每年发布的定期报告包括四份季报、一份半年报以及一份年度报告,届时基金的仓位在每个报告中也有所体现。而其余时间内,公募基金均未公布其仓位数据。
另一方面,从数据来看,即使是在同日发布的由不同券商出具的基金仓位监测报告数据,往往也存在着较大出入。
那么,目前层出不穷的基金仓位监测报告究竟如何从无到有?监测依据的原理及模型又是如何?引发争议的基金仓位监测究竟是否有其意义?理财一周报就上述问题采访了多家拥有业内首批基金评价资质的券商研究所。
在采访过程中,得知目前回归原理为监测基金仓位采用较多的方法,而几乎每家券商在操作细节上均有不同,这些不同均会导致最终出炉的数据有所差异。
与此同时,采用回归原理测算基金仓位的重要前提假设即是真实基金仓位在一定时间内未发生剧烈变化。
一位券商基金评价研究中心负责人对谈及原因时表示:“既然叫测算,那么和真实结果总是有所误差的。另外,目前券商测算基金仓位基本都是基于历史的统计,而真实基金仓位则是一个不断变化的动态数据。”
测算方法基本原理为回归
按照民生证券基金研究中心总经理马永谙的划分,至今基金仓位监测模型一共经历了四代。
第一代测算模型选取基金平均收益率、基准指数收益率为基础指标,将样本基金收益率均值除以基准指数收益率,得到结果即为基金平均仓位。
第二代则是在一代的基础上,通过对基金收益、市场指数收益时间序列数据的回归进行测算。
第三代为对单只基金与其基准的收益序列进行动态回归。
第四代即为马永谙现采用并称之为“与回归原理完全不同”的测算模型。
事实上,在接受理财一周报采访时,马永谙也坦承模型代数的划分仅是个人的归类。而就了解的情况来看,抛开模型代数不谈,回归原理为目前大部分研究机构进行基金仓位监测的基本原理。
海通证券(600837
股吧,行情,资讯,主力买卖)首席分析师娄静博士在接受采访时表示:“等于说基金每天都有一个净值增长率,然后市场指数又有一定的波动,这实际上就是一种回归的关系。比如说指数涨了很多,基金净值没有涨,很有可能原因就是因为仓位比较低。所以主要原理就是根据市场涨跌和基金净值涨跌的关系,以回归来测算大概的仓位水平。也就是利用基金净值的涨跌和它自己的投资组合根据市场波动应有的涨跌来进行测算。”
再来看基于回归原理的仓位测算基本模型,该模型为R=α+βRm+ε,其中:R为自变量,即基金的收益率序列;Rm为因变量,即基金持有的股票组合的收益率序列;α为常数项序列;β为自变量与因变量的相关系数序列,即监测的基金仓位;ε
为误差修正项。
必须注意的是,作为理论上应为开放式股票型基金所投资证券的收益率的应变量Rm,由于基金持有股票组合真实情况并不能随时披露,因此目前研究机构通过基金重仓股加上指数收益或完全采用指数收益来代替。而所采用的指数在研究机构中也并未达成共识。
对于为何采用回归理论来检测基金仓位,一位使用回归理论进行基金仓位监测的分析师对表示:“基金净值、市场序列、仓位,这三者之间只能通过回归才能较好地联系起来,而且回归可以剔除较多的噪音。”
各家机构模型细节均有不同之处
尽管采用的基本模型均是基于回归原理搭建,但是了解后发现,业内几乎各家研究机构在细节上都有所差异。6月14日,马永谙在电话中告诉:“虽然现在基本原理都是这个,但是各家模型都有细节上的不同,所以差异还是蛮大的。”
与此同时,上海证券基金评价研究中心副总经理李艳在接受采访时表示:“目前,采用线性回归原理的比较多。但是回归里面操作细节又是不一样的。比如自变量取法是不一样的,数据长度区间是不一样的,回归出来结果肯定是不一样的。”
她表示,有很多操作细节,比如说有人把股票型基金作为整体来测,有人是把单个基金先测出来然后再算股票型基金的整体情况。这两个方法就有不一样的结果。另外,测算方法只是一个模型,但是前提条件是样本量足够大,基础数据要足够准确。比如净值收益率,有人用复权的,有人用累计的,数据滚出来的结果自然就是不一样的。
据了解,有一家券商基金研究中心就有两名分析师同样以优化方法+线性回归,从不同角度来做基金仓位测算。其中一名分析师自下而上、精确到每个单只基金的仓位再来计算一类基金的整体仓位,另一名分析师则算的是行业整体的仓位。
以平安证券《单只基金仓位测算模型》显示,其主要通过三类方法来进行单只基金的仓位测算。首先依据规模指数做组合,可采用中证规模分类(如中证100、中证200和中证500),或采用申万风格指数。以上指数回归所得系数之和即为基金仓位。其次,依据行业分类做组合,依据中证一级行业分类或者申万一级行业分类做组合,方法同上。最后,依据基金重仓持股做组合,以基金定期报告的重仓持股明细作为基础组合与基金净值做回归,预测单只基金仓位。
同时,马永谙也表示:“线性回归也不是一个单一的算法,也有很多改进型的算法,差异非常大。每家机构都有自己的独到之处。因为线性回归有其天生的缺陷在里面,所以每家都在不断去调整。金融模型慢慢发展下去会是每个企业的核心竞争力,相当于发明专利。所以每家都不可能把自己的金融模型公开,但是都有其特色所在。”
谈及自己所使用的“第四代”仓位监测模型,马永谙告诉,该模型的核心算法可以理解为一个很复杂的方程,解算并不是线性回归。同时,模型本身不是一个单一模型,而是多因素模型。比如说,以前的单因素模型里因变量是收益,但该模型因变量不光是收益,还有其他的东西。而当要求是否可以进行详细了解时,马永谙表示,那是他的核心算法,并不方便透露。
方法没有孰优孰劣
未来很难出现标杆模型
通过采访,了解到目前仓位测算方法多数是用回归原理,差别无非是在对投资组合的近似上,每家机构采用的不一样。较为粗略的方法就是纯粹使用市场指数,但即使是在市场指数方面也有所不同,有机构只用沪深300,有机构用沪深300加上中证500,也有机构用纯市场指数。
另外,不少机构按照每个基金季报披露的十大重仓股收益来算,而对于其余不知道的投资组合部分以市场指数来代替进行近似。与此同时,因为单个基金季报里有披露基金投资组合的行业,因此有机构也用到行业指数。
谈及目前各类在细节上均有不同,却又均基于回归原理的测算模型,娄静表示:“没有说哪种方法一定好,否则大家都采用一种方法。时间段选取不一样,结果会差很多,我听说时间序列上还有机构选一个月的,那么测算结果就是一个月的平均仓位。所有方法都是近似,可能这个方法现在准点,其他的方法在另一个时间准点。”
这样的观点也得到了其他业内人士的认同。一位具体从事基金仓位测算的分析师告诉:“回归原理一定有个时间序列,一般来说区间定在14天。从涵义来说,回归的重要前提是基金期间的仓位是不会剧烈变化的。但是如果以14天作为测算的时间序列,结合市场实际情况来看,有些小基金公司会有突然大幅增减仓的举动。这样的举动就会对检测出来的结果导致较大的偏差。时间上的取舍存在分歧,很难统一。”
从与多位基金分析师接触下来的情况来看,他们均表示:“用各种方法精细到一定程度后,就很难说出哪个模型一定好。”
任何仓位测算方法均和实际结果有所偏差
除去目前运用仓位测算方法的大致分类外,令人关注的就是基于回归原理的测算方法和基金真实仓位相比其准确度如何?
需要提出的是,由于目前基于回归原理的改进型算法很多,各家机构所采取的算法在细节上也都有差异。因此,每家机构仓位测算人员对于其他机构仓位测算模型准确度并不了解。
在采访中,马永谙曾对表示:“我从2005年开始就回归原理进行仓位测算,如果市场好的话,用线性回归计算的误差率在2%。”对于他所称正在使用的第四代模型,他表示现在模型测算基金增减仓行业的准确度在73%至86%。而对于单纯的基金仓位测算,他表示数据误差率在0.05%到0.5%之间。比如说,测算结果是90%的仓位,最后结果可能是89.95%和90.05%,这是最好的结果,最差的话误差在0.5%。
与此同时,上述一位具体从事基金仓位监测分析师告诉,其误差率在2%上下。他所使用的方法为通过基金净值走势和指数走势,以回归分析估算出仓位。同时,并没有使用基金季报公布的信息,所使用的指数为中证100、中证500以及沪深300。
无论各家机构测算偏差如何,从事仓位测算的基金分析师都表示,所有的测算方法都是近似,并不能做到和基金的真实仓位完全一致。娄静表示,数据的准确性和市场波动程度也有关系,市场波动程度越大的时候,准确度会越高。举个极端例子,市场所有股票涨停板,这时候仓位测算是非常准的。因为每只股票涨幅都是一样的,所有组合收益率测算得都非常准。如果波动很小,市场分化很多,比如大盘股涨特别多,那么无论采用行业也好、重仓股也好、市场指数也好,市场中只要有某一类股票涨的话,那就出现偏差了。
她指出,重仓股算法用前十大重仓股,后面的股票用一个市场综合指数来代替。由于某一类涨得特别好,近似可能就有偏差。除去齐涨共跌外,导致仓位测算会比较准的还有一种情况,市场板块涨跌没有那么明显,看不出是大盘股还是小盘股好,在这样的市场环境下仓位测算也是比较准的。
除去市场波动程度,导致各家券商出具的仓位测算报告数据差异的原因还有测算方法和时间选择的不同。另外,即便是拿单家券商出具的基金仓位测算结果去和基金的真实仓位相比也很难得到一个精确的答案。
比如有某家券商6月30日正好发布了一个仓位测算报告,如果拿基金的二季报数据去和此测算结果相对比,这样的方法也并不是完全合理。因为券商根据回归原理测算的是基金一段时间内的平均仓位,而基金公布季报的仓位是最终时点的仓位。
既然仓位监测数据和真实数据会有差异存在,那么今后基金仓位监测模型是否存在可以改进的空间?遗憾的是,从了解到的情况来看,这一可能性或许也不大。
上述基金分析师表示:“大家在建立模型时,已经考虑到各种可以获得的信息,除非是提供更多的信息给大家,否则大家很难再优化自己的模型。如果拥有更多的指数,就拥有更多序列,在这种情况下可以增加一些精确性、增加一些方法。”
他指出:“我这里首先就是样本序列选择问题,目前的这些序列其实不是最好的代表。就是说目前只能按照市场提供的序列来做,市场序列没有能够进行再细化。我说个未来前景,比如一个大的中证流通、沪深300,再选一些尽量少的、能够涵盖有特色的,比中证100、中证500再细点,交叉的相关性再降低点。”另外,他指出,序列样本点的选择又是一个矛盾,不能太过细,太过细没法做。目前,选择三到四个指数已经快到空间的极限了,不可能用10个。