核心观点
真假序列识别的意义及研究思路
本文采用一个相对新颖的研究问题——真假市场价格序列的识别,并以机器学习为研究工具,考察真实市场价格序列是否包含与随机生成的虚假市场价格序列显著不同的信息,从逆向逻辑上检验市场交易信息是否存在规律,进一步探索基于交易信息的技术分析的可靠性。结果表明,单纯基于价格的技术分析的可靠性值得怀疑,数量可能比价格更有用。
虚假序列的产生及其特征
本研究选取收益率作为“价格”信息的代表,换手率作为“数量”信息的代表,4个广基指数和29个一级行业指数作为样本目标,60个交易日作为样本长度。通过随机打乱收益率和换手率的时间序列,产生虚假序列,保证同一个交易日的收益率和换手率对应。收益率和价格的真假序列,仅凭肉眼几乎无法分辨。与虚假换手率序列相比,真实换手率序列表现出更强的趋势性和平滑性。
卷积神经网络模型具有突出的性能,优于其他机器学习模型
模型的初步筛选结果表明,卷积神经网络(CNN)识别真假价格序列的能力突出,性能明显优于其他模型。支持向量机和全连通神经网络表现出一定的识别能力,但普遍较弱;而logistic回归、随机森林、XGBoost等模型识别能力很小。我们推测原因是传统分类器依赖特征工程,需要从原始数据中人工提取特征;卷积神经网络本身具有提取特征的能力,并且对图像数据的局部特征具有很强的识别能力,因此适用于相似图像形式的时间序列识别。
离职率序列的识别效果较好,技术指标的引入没有明显改善
基于收益率和换手率序列的模型具有很强的识别真假序列的能力,表明市场上的价格序列包含非随机特征。将收益率序列和周转率序列分开测试,发现基于收益率序列的模型识别效果差,召回率低;基于离职率序列的模型识别效果较好。因此推测价格序列的主要信息来源于周转率,而收益率包含的信息较少或者难以提取。进一步尝试通过技术指标提取收益率信息,发现DIF、MACD、PSY指标的引入并没有显著提高识别效果。所以推测这些基于价格的技术指标带来的增量信息是有限的。
单纯以价格为基础的技术分析的可靠性值得怀疑,数量可能比价格更有用。本研究的检验结果表明,周转率序列具有可识别特征,CNN模型在外推时间间隔内仍具有良好的识别性能;而基于收益率序列的CNN模型无法识别真假序列。换句话说,基于数量的技术分析可能是合理的,而仅仅基于价格的技术分析的可靠性是值得怀疑的,所以数量可能比价格更有用。价格、收益率或基于价格的技术指标中包含的信息可能有限,可能需要与周转率、成交量或其他基于成交量的技术指标结合使用。
神经网络的Grad-CAM可视化:模型识别依赖于局部特征。采用Grad-CAM方法对基于周转率序列的CNN模型识别过程进行可视化。连续实序列的热图显示出明显的连续平移迹象,表明该模型对真假序列的识别主要来自于对周转率序列局部特征的识别。结合Grad-CAM热图和一些真实的换手率序列,发现CNN模型能够提取连续高换手率和大幅降低换手率的局部特征。总的来说,对模型的识别机制和特征提取方法还缺乏深入了解,难以直观解释,需要进一步研究。
风险提示:真假价格序列识别的研究是对市场规律的探索,不构成任何投资建议。基于周转率序列的卷积神经网络模型可以有效识别真假序列,并不意味着周转率等成交量相关指标可以直接应用于投资。机器学习模型是历史规律的总结。如果市场规律发生变化,这种模式可能会失败。
来源:金融网站
1.《涨乐财富通是真是假 华泰证券:技术分析是否可靠?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《涨乐财富通是真是假 华泰证券:技术分析是否可靠?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guonei/1596067.html