引导阅读

1.作为“西学东渐-海外文献推荐”系列报告中的第42份报告,本文推荐了“使用机器学习方法的基金资产介绍:投资组合中有什么?”2019年由David byrd,sourabh bajaj,tucker hybinette balch出版。》。

2.由于只有大型共同基金的历史净资产值,要找出这些基金持有哪些股票非常耗时。比如你想从C 建立一个30股的投资组合,会有C或者1.4×10 ^ 48个可能的股票组合,用今天表现最高的计算器来推断成分股需要几百万年。

3.为了解决计算耗时的问题,本文不仅对现有的扩展线性克隆方法进行了扩展,还引入了一种新的顺序振荡选择方法,该方法以智能的方式探索股票池,从而更快地找到组合的组成股票。这些解决方案在金融领域有许多潜在的应用,比如检测基金经理的财务装饰,或者基于大规模基金头寸的预测开发套利策略。

4.根据仓位不同,扩展线性克隆算法运行时间为3 ~ 4秒,准确率在6.8% ~ 72.5%之间,说明传统线性克隆算法的扩展无法很好地处理成分股未知时的资金仓位预测。顺序振荡选择算法运行时间为8-15秒,准确率在88.2%-98.6%之间。虽然计算速度比ELC慢,但在普通笔记本电脑上只需10秒就能完成,分类精度也有显著提高。

风险预警:文献中的结果由相应作者通过历史数据统计、建模计算完成,存在政策和市场环境变化时模型失效的风险。

一.导言

只有大型共同基金的历史净资产值,怎么知道基金持有哪些股票?找到一套准确的答案是很费时间的。比如你想从C 建立一个30股的投资组合,会有C或者1.4×1048个可能的股票组合,即使用今天性能最高的计算器,也需要几百万年来推断成分股。为了解决这个耗时的问题,本文不仅扩展了现有的线性克隆方法,还引入了一种新的序列振荡选择方法。这些方法可以检测基金的财务装饰,或者基于大规模基金头寸的预测构建套利策略。本文通过对ETF成份股的预测来检验这些方法的有效性。根据仓位不同,扩展线性克隆算法运行时间为3 ~ 4秒,准确率在6.8% ~ 72.5%之间,说明传统线性克隆算法的扩展无法很好地处理成分股未知时的资金仓位预测。顺序振荡选择算法运行时间为8-15秒,准确率在88.2%-98.6%之间。虽然计算速度比ELC慢,但在普通笔记本电脑上只需10秒就能完成,分类精度也有显著提高。

给定一组投资组合价值时间序列,对于成分数量未知的投资组合,我们的目标是预测其特定的成份股和权重。考虑一个具体的例子:给定一只大型共同基金的历史净资产值,该基金持有标准普尔500指数中的哪些股票?重量是多少?有很多实际应用可以解决这个问题,比如检测金融装修。该基金可能会在报告截止日期前重新安排其投资组合,以显示其持有声誉良好的股票,但实际上它一直持有风险资产。能预测仓位的投资者可以在重要仓位披露日之前调整自己的股票仓位,从而在披露后获得利润。

根据过去的研究,夏普解决了预测基金面临哪些广泛的资产类别的问题。Edirisinghe、陈和Kwon等人解决了指数跟踪问题。然而,我们的方法是在事先不知道任何附加信息的情况下推断特定资产及其权重。我们只知道股票池中每只股票的每日收盘价和目标投资组合的每日净资产。

本文的第一种方法是基于Hasanhodzic和Lo的线性克隆方法。最初的线性克隆方法是模型可以在成分股票c已知的情况下估计组合权重w。我们的扩展是利用线性克隆的方法,在得到权重w之前预测成分股票c。换句话说,在现有技术中,用已知的C来估计W,我们推广了这个问题,就是如果不知道成分C怎么办?在第二种方法中,我们将夏普与一种机器学习技术——顺序向前选择算法相结合,并以“智能”的方式探索候选投资组合,以便更快地找到有效的子集。模型的目标是预测共同基金的头寸,以ETF为例,我们通过预测ETF的成份股来检验这些模型的有效性。

二.背景及相关工作

在本文中,我们修正了SFFS技术,旨在估计已知每日净资产值的基金的位置。该方法的关键改进是提出了一个预测组合成份股的模型,而不是只预测风险因素或大规模克隆资产类别。

大型对冲基金和所有共同基金需要每季度向证券交易委员会报告其重要持股情况。不受强制报告约束的对冲基金也可以自愿披露其部分或全部持股。事实证明,这些披露的时间点会显著影响公共资产的交易量和价格,因为投资者渴望买入或卖出高业绩基金增持或减持的股票。如果利用公告前的公开数据能够正确推断出基金的持有目标,那么投资者除了市场进入或退出风险小之外,还可以在不存在内幕交易问题的情况下获得潜在收益。

Kacperczyk,Sialm和郑研究了未观察行为对共同基金的影响。他们根据之前披露的持股情况计算预期回报,并与基金的实际回报进行比较,并将回报差异作为衡量基金经理经营业绩的指标。他们的工作不仅评估了隐藏成本和隐藏收益之间的相关性,还讨论了利用这一回报缺口预测共同基金业绩的可能性。

Meier和Schaumburg在使用组合头寸作为业绩衡量标准时发现了一些常见的问题,如缺乏详细的持股进入/退出日期、披露时间点的收益与之前披露的持股数据计算的收益之间存在差异、将基金用于自己的组合、故意调整披露时间以掩盖基金的实际投资策略等。以前的文献已经评估了资产披露的效果,我们的目标是提供一种预测披露的算法。

在夏普的研究中,他将共同基金分为几个资产类别,如成长股、债券、大市场等。我们使用类似的方法,但使用更精细的分类,即单一股票。冯和谢长廷使用相同的技术对对冲基金进行主成分分析,产生了良好的结果,但仍然是在投资风格和资产类别的水平,而不是单一的股票。

Hasanhodzic和Lo探索了线性克隆的方法,并使用回归方法来拟合对冲基金可能暴露的一些风险。回归中的每个因子代表整个资产类别,如标准普尔500指数、美国债券市场或美元,对应的回归系数代表这个类别的权重。在他们的工作中,他们测试了输入数据的两个变量:使用整个基金历史或使用预测时间之前的24个月。虽然大多数创建的投资组合不如实际的对冲基金,但它们在计算方面的表现使得它们的探索非常有意义,值得进一步研究。通过改进他们的滚动线性克隆方法,我们将预测资产类别扩展到预测基金持有的个股。

我们的目标是填补前人研究的空空白,提供一种仅利用目标基金的每日收盘价或净资产值以及股票池中所有股票的每日收盘价来预测基金头寸和权重的方法。

三.投资组合头寸预测

其中x是预测分类的集合,y是实际分类的集合。实验中的两类是True和False。因此,我们可以把TP定义为我在x和y两个方向上标记为真的股票数量,TN定义为我在x和y两个方向上标记为假的股票数量,FP定义为我在x方向上标记为真但在y方向上标记为假的股票数量,FN定义为我在x方向上标记为假但在y方向上标记为真的股票数量。R表示分类的准确性。

当标准普尔500指数作为股票池时,ELC方法的预测精度为0.068-0.725,平均值为0.357。SOS法预测精度为0.882 ~ 0.986,平均值为0.933。SOS的错误分类比ELC少90%。具体结果如图3和图4所示。

事实上,这种简单的衡量预测精度的方法存在一个问题,即真实数据中对类尺度的敏感性,这种问题被称为类不平衡问题。在我们的例子中,股票池中的大多数股票都不属于目标投资组合。如果算法预测所有答案都为False,则其分类准确率R不会太低,高估了算法的有效性。

5.2

马修斯相关系数

面对明显的类不平衡问题,我们使用马修斯相关系数来评估我们算法的有效性。MCC通过考虑真实预测集中类别的大小来评价二进制分类性能,因此可以处理规模不平衡的问题,这是其他分类指标无法达到的。).MCC计算结果的解释与皮尔逊相关系数,值0.1表示低相关,0.3表示低正相关,高于0.7表示高正相关,负值表示负相关。

ELC法的MCC为0.000-0.365,平均MCC为0.170,说明相关性较弱。SOS法的MCC为0.561 ~ 0.891,平均MCC为0.664。

不及物动词结论

我们扩展了投资组合预测问题,其解决方案在金融领域有许多潜在的应用,包括检测基金经理的财务装饰和基于大规模基金头寸预测开发的套利策略。值得注意的是,不同的问题有不同的目标。在指数跟踪的情况下,目标是最小化跟踪误差,而对于投资组合头寸预测,目标是准确预测投资组合的成份股。

针对投资组合头寸预测问题,本文提出了ELC和SOS两种解决方案,并从不同维度对两种模型的性能进行了评价。ELC方法是现有指数跟踪方法的扩展,是减少头寸确定时跟踪误差的有效方法,但结果表明它在预测组合的成份股时表现不佳。根据统计,ELC没有提供比随机分配股票作为投资组合更有效的预测。线性克隆方法是由哈桑·德兹奇、罗和夏普提出的。虽然已经证明这种方法对于组合表现复制和预测固定数量的资产类别是有效的,但是当成分股票未知时,这些方法似乎不能很好地扩展到组合预测。其实他们的目的只是为了解决权重分配的问题。

本文提出的新方法SOS比ELC法和随机分配法具有更好的精度。SOS以“智能”的方式探索候选组合,以便更快地找到有效的子集。比如在预测道琼斯工业平均指数ETF成分股时,ETF成分股的正确大小是30。SOS法预测的成份股数量为54只,其中预测正确的有27只,而ELC法预测的成份股数量为206只,其中只有29只是正确的,准确率比较低。SOS方法虽然计算速度比ELC慢,但在典型应用中,在普通笔记本电脑上只需10秒钟即可完成,分类精度也有显著提高。

在我们的评估中,ELC方法大大高估了大多数基金的实际头寸。事实上,在没有任何约束的情况下,这种方法通常表明股票池中的所有股票都是成份股。由于部分成份股配置很少,我们在ELC方法中加入了最小门槛限制,提高了预测效果,但还是不如SOS。

虽然SOS的表现远比ELC好,但仍有改进的空间。比如重复实验,如果最大投资组合规模限制在100,最小包含权重限制在1%,两种方法的性能都会有所提高,说明算法还有很大的提升空间。例如,权重约束、动态最小权重阈值、或关于正确投资组合规模的一些先验知识等。

参考

Agarwal,v .,K. A. Mullally,Y. Tang,B. Yang。2015."强制性投资组合披露、股票流动性和共同基金业绩."金融杂志70:2733–2776。

艾特肯,m .,和a .弗里诺。1996."滴答测试的准确性:来自澳大利亚证券交易所的证据."银行与金融杂志;金融20:1715–1729。

阿尔卑斯投资组合解决方案经销商有限公司“选择部门”2018,

阿门茨、弗·戈尔茨和勒·索德。2009."基于特征的指数的表现."欧洲金融管理15:241–278。

阿门茨,n .,l .马泰利尼,J. C .梅弗雷迪和v .齐曼。2010."被动对冲基金复制——超越线性案例."欧洲金融管理16:191–210。

巴尔迪、保罗、布鲁纳克、肖万、安德森和尼尔森。2000."评估分类预测算法的准确性:综述."生物信息学16:412–424。

贝茨马斯、戴普、科岗和洛城。"不完全市场中衍生证券的定价和套期保值:一种-套利方法."国家经济研究局,1997年。

陈、陈少华、权瑞华。2012."稳健的指数跟踪投资组合选择."电脑和。运筹学39:829–837。

Compustat。“计算机统计——资本智商——指数成分。”2018

克罗齐和彼得雷拉。2015."围绕对冲基金交易的价格变化:分离交易和披露效应."管理杂志;治理19:25–46。

北卡罗来纳州伊德里辛格,2013年。"指数跟踪最优投资组合选择."定量金融快报1:16–20。

埃德蒙斯特,1972年。"财务比率分析对小企业失败预测的实证检验."金融和定量分析杂志7:1477–1493。

行为科学的简单统计。加利福尼亚州太平洋格罗夫:布鲁克斯/科尔,1996年。

Frank,M. M .,J. M. Poterba,D. A. Shackelford,J. B. Shoven。2004."模仿基金:信息披露监管和共同基金行业主动管理的回报."《法律与经济杂志》47:515–541。

冯、魏、谢。1997."投资风格与注册税务师回报的生存偏差:跟踪记录的信息内容."投资组合管理杂志24:30–41。

Hasanhodzic,j .,和A. W. Lo。2007.“对冲基金的回报可以复制吗?:线性案例。”投资管理杂志5:5–45。

亨利,E. 2006。"市场对收益新闻稿语言成分的反应:使用预测算法的事件研究."会计新兴技术杂志

3 : 1–19.

休伯特和阿拉比。1985."比较分区。"分类杂志2:193–218。

纽约贾普科维茨和斯蒂芬。2002."阶级不平衡问题:一项系统研究."智能数据分析6:429–449。

琼斯,e,T. Oliphaunt,P. Peterson等,《SciPy:Python开源科学工具》2001

kaperczyk,m .,C. Sialm,L. Zheng。2006."共同基金未被观察到的行为."金融研究评论21:2379–2416。

Kat,H. M .,和H. P. Palaro。2005."对冲基金回报:你可以自己创造!"财富管理杂志8:62–68。

马修斯,公元前1975年。" T4噬菌体溶菌酶二级结构的预测和观察比较."生物化学与生物物理学学报-蛋白质结构405:442–451。

迈耶,I .,和e .绍姆堡。“做基金橱窗装扮?美国股票共同基金的证据。”工作文件,西北大学,2004年。

皮尔逊,K. 1895。"关于双亲回归和继承的注记."伦敦皇家学会会刊58:240–242。

power,D. M. 2011。"评价:从精确、回忆和f检验到ROC、信息性、标记性和相关性."机器学习技术杂志2:37–63。

Pudil,p,J. Novovicˇ ová,J. Kittler。1994."特征选择中的浮动搜索方法."模式识别字母15:1119–1125。

兰德,W. M. 1971。"评价聚类方法的客观标准."美国统计协会杂志66:846–850。

夏普,1992年。"资产配置:管理风格和绩效衡量."投资组合管理杂志18:7–19。

Somol,p .,P. Pudil,J. Novovicˇ ová和P. Paclı k. 1999。"特征选择中的自适应浮动搜索方法."模式识别字母20:1157–1163。

雅虎!金融。2018.“雅虎!金融互动图表。”2018,

风险预警:文献中的结果由相应作者通过历史数据统计、建模计算完成,存在政策和市场环境变化时模型失效的风险。

时期

链条

相遇

证券研究报告:《西学东渐——海外文献推荐丛书第42期》。

对外发布时间:2019年9月19日

-

联系人:徐夤

电话:18602155387,021-38565949

电子邮件:xuyinsh@xyzq.com.cn

-

联系人:郑

电话:13918491550

微信:13918491550

电子邮件:zhengzhaolei@xyzq.com.cn

-

更多量化的最新信息和研究成果,请关注我们的微信公众平台!

1.《基金预测 使用机器学习方法预测基金持仓》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《基金预测 使用机器学习方法预测基金持仓》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/1732070.html