苏宁金融投资策略研究中心主任顾慧君:智能投顾背后的基础是量化投资

  金融界网站7月5日讯 由苏宁金融举办的2019苏宁金融智慧投资高峰论坛今日在南京举办。苏宁金融投资策略研究中心主任顾慧君发表量了化投资新趋势的演讲。

  顾慧君表示,我今天交流的题目是《量化投资新趋势》,刚才业界领先的基金公司博时基金的王总已经做了非常专业和详细的介绍,下面我从投资者的角度,从一个更通俗的角度来跟大家谈一下我们苏宁金融研究院对于量化投资以及它的发展趋势的一些看法。

  首先看一下什么是量化投资,我们大家都知道有一个股神叫巴菲特,1965年到2014年巴菲特掌管的公司投资业绩是非常出众的。

  如果在1965年你买了这个公司价值1块钱的股票,在2014年大概能得到182616元,这个回报是非常惊人的。而标普500在同一时间段的回报是11596元,所以两者的差距是非常大的。

  70年代、80年代末、90年代末的时候,巴菲特的表现略低于标普500以外,其余所有的年份他几乎全部胜出。所以学界里面掀起一股热潮,希望能够打开巴菲特投资的黑匣子。我们很多金融领域的专家希望能够找到去解释这个艺术科学的方法,在2018年有纽约大学金融系的两位教授和他的合作者发了一篇在金融圈子里面影响力非常大的文章,叫做《量化巴菲特》或者叫《巴菲特阿尔法》,希望通过我们之前的学术研究以及发现的一些因子去解释巴菲特的投资收益到底从何而来。经过这篇严谨学术论文的验证,他们发现有六个因子可以来解释巴菲特投资的秘诀,第一个就是我们的市场,就是我们β这个因子;第二个是规模,就是这个公司是大还是小;第三个是估值的高或者低;第四个是动量,动量我们一般用一个时间段以来这个股票的涨跌幅来表示;再比如说质量因子,再比如说低波因子,他们发现如果根据这六个因子来形成一个组合,甚至能超过巴菲特投资的业绩。

  我们把投资的方式分成三类,一类叫被动投资,就是从最近几年以来,在中国的市场已经开始慢慢被一些投资者接受。比如说你买去一个沪深300的指数基金,买一个中证500的指数基金,通过持有这些基金来获得所有上市公司的或者市场的平均回报。我们的投资希望市场上涨带给我回报,这个就是叫所谓的被动投资的概念。最右侧就是我们叫α,我们叫主动投资,也就是说你不是去投一个市场组合,而是通过自己的方法,自己的选股来选择一个投资组合,如果这个投资组合能够获得回报,我们把这个回报叫做α。

  刚才我们在量化巴菲特的例子当中,我们把巴菲特的一些投资经过因子来进行解释之后,形成了一系列的smart β的组合。因子投资和被动投资有什么关系呢?它实际上是两种组合,把我们投资的因素提取出来,形成一个组合,并且制定严格的交易程序来进行投资,这种方法我们就称之为量化投资。

  我们今天之所以介绍量化投资,其实不管是我们的FOF也好,还是我们的智能投顾也好,它背后的基础就是量化投资。

  我们来看一下量化投资和传统投资相比,优势是什么,弱点在哪里?从优势角度来看,它的客观性更高一点。我们个人投资者在买股票或者买基金的时候,往往他的判断是相对随意的,缺乏一个客观的标准。但是量化投资有非常严格的标准,比如说举个最简单的例子,如果根据我们的因子模型选出来需要市值在多大规模上的投资,就是给你一个选择的标准,客观性很高。

  第二个是投资视野很宽,比如说我们一个个人投资者,他可能能够同时持有的股票,或者他的知识阅历和他的投资经验能够帮他同时管理10支左右的股票可能甚至20支30支,但是到了50支以上甚至更高,很多投资者就无法覆盖了。但是我们的量化投资是全市场根据某些因子来进行筛选,所以他的投资视野非常宽,可以跨行业、跨地域、跨品种,不同类型的股票都可以覆盖,所以他的投资视野很宽,可以起到更好的分散的作用。

  第三个是行为偏差是很低的,在这方面量化投资可以帮助我们最大限度地控制行为因素对我们投资的影响,可复制性当然更高了。

  比如说我们形成一个量化模型以后可以复制,可以形成一个产品,但是我们很难向一个投资高手真正地复制他的投资经验,他的成本很低。大家看,基于量化投资方法来管理的基金收费相对更低,风险控制更强。这个是它的优势。

  它的劣势在哪儿?第一个,它对定性数据的理解比人脑要弱。量化对于定性数据的理解比人脑要弱,但是随着现在人工智能的发展,机器对于定性数据的理解也正在上升,比如说自然语言处理技术,随着NLP技术的进展,我们对于很多语义的解析已经越来越接近于人脑对语义的解析。

  第二个是对人脑的依赖,在这个很短的历史数据当中,我们还有几个重要的时间点,在这个时间点前后它的数据标准上有非常多不一致的地方,不仅时间短,而且数据的计量准则上发生非常重大的变化,导致这个数据的可比性有一定的问题。这是第二个缺点。

  第三个,就是数据的挖掘,也就是量化当中我们非常容易自己创造一些因子。比如说我们通过人工智能的这些方法,通过组合分析,我们发现某些成分对于股票的收益作用非常强,但是未必背后有非常坚实的分析基础,数据很强,但是常识上很弱。

  第四个弱点,就是对意外事件的反应速度比人可能要稍微慢一点,因为意外事件对于市场的冲击,我们过去这种事情不常见,黑天鹅是偶发的,我们量化投资是基于大量的重复的长时间的数据去发现一个规律,发现一个模式,当遇到一个新的情况以后,它可以很快地根据历史经验总结出应对的方法。但是这些意外事件或者黑天鹅事件在历史上本来就发生得非常少,这种事件发生之后,对于整个股票市场或者对于单支股票或者某些基金到底有什么样的冲击效应,其实量化投资很难告诉你。

  第五个弱点,就是策略的相似度,刚才智能投顾也讲到大概是三种模型,基于类似的模型所形成的智投组合会不会引起涨的时候同时涨,跌的时候过度跌?就是所谓拥挤的问题。在量化投资里面也有这样的问题,我们大家如果都看好一个因子,会不会引起这个因子拥挤的问题?这个因子本身被估值过高了,导致它将来可能也会面临比较明显的回撤,所以它有策略相似度的问题。

  这里面所想讲的就是人工智能技术或者说其他的新兴技术应用之后有没有可能改善上述的问题?下面跟大家做一个简单的交流,首先我们看一下人工智能技术的进展,刚才王总也提到所谓的弱人工智能、强人工智能和超人工智能。人工智能技术的发展大概可以按照拟人的程度来划分它的进展,当然也有人分成另外三层,计算智能、感知智能和认知智能。这是一种分析方法。

  还有一种分析方法,它现在基本上还处于一个弱人工智能的阶段,四也就是说我们现在的人工智能大部分还是依赖于海量数据在事先构建的模型中进行训练,它和我们传统方法的区别并不是那么明显。所以它需要目标给定、任务明确时,展现强大的计算和认知。金融市场是一个相对开放的规则系统,所以它的可能性非常多,甚至有的时候我们很难进入它的边界,这个时候我们就需要有没有强人工智能。所谓的强人工智能,比如说我们的无监督学习就是一种强人工智能,这个时候它不局限于单一目标能够自主学习,完成通用的任务。

  弱人工智能最有代表性的就是有监督的学习,我们给定规则,然后来训练机器,完成某种形式上的一个函数关系。无监督学习是有规则的,让机器自己发生规则,这是一种强人工智能。还有一种是超人工智能,具有批判性分析问题的能力。

  我们分析人工智能在量化投资当中应用的时候,我们总结了一下它能够改进什么东西?我们认为主要有三个方面的改进,第一个是缩短新因子的开发周期,主要是有两方面的效果,第一个是我们人工智能就等于大数据+机器学习。随着人工智能技术的进步,我们对于数据的搜索、整理和处理的能力在快速提高,所以说它能够帮助缩短对于因子的提炼和表征的时间。我们可以很快速地提炼一个因子,很快速地找到它准确的表征,就是我们用哪些变量去衡量,哪些方式去测量这个因子,这个时间是缩短了很多的。

  第二个可能性,过去我们其实没有办法在传统的量化投资里面处理的这些信息,我们现在在大数据或者人工智能技术的辅助之下可以处理了。举个例子,比如说过去的一些舆情,目前比较热的就是希望把这些舆情的数据纳入到模型中进行量化新的因子,看看对中国这样一个市场波动率很高或者情绪的市场是不是能够带来收益?过去舆情都是非结构化的数据,依赖于过去的技术,我们对结构化数据的处理能力很弱、处理成本很高。但是随着语义分析技术,包括语音文本分析技术的进步,我们现在可以很方便很快速地对于语音、图像、文本进行快速的处理,把这种非结构化的数据转变为结构化数据,应用到我们量化分析里面来。

  这是第一个,它可以开发新因子,把这个新因子的开发周期大规模缩短。

  第二个,能够较好地处理不同因子之间的数据重叠,我们大家都知道很多人工智能的方法或者机器学习的算法它其实并不关心这些因子之间的贡献性问题,它自己能够自动处理这些因子之间的信息重叠问题。

  第三个,它能够非线性地组合因子。大家知道如果用传统的统计方法统计模型来处理这个因子的时候,它都是把它归因到一个线性模型或者一个对数模型,或者顶多是一个多元方程里面,在因子和收益的这个函数模型上很难有大的突破,但是利用我们的人工智能技术,我们就可以发现因子以及股票的回报或者基金回报之间很多非常丰富的非线性关系,这样可以更准确地捕捉到各类因子对于最终收益的贡献。

  从这三个角度来看,某种程度上,人工智能技术可以帮助我们有效地解决某些量化投资先天性的弱点,比如说对于定性数据的理解,对于历史数据的依赖等等,它可以挖掘更多的数据源来补充它的弱点。

  这儿举一个简单的例子,我们目前也正在跟一些舆情机构合作,我们公司跟一些舆情合作伙伴合作,比如说我们在媒体库基础上使用我们的自然语言处理技术,大概提取了500多个舆情因子,与我们传统的基本因子和量代因子结合,通过我们LSTM深度学习模型结合,形成了一个综合的策略,目前这个策略的回撤效果还比较理想,我们也应用到我们管理的一个私募基金上去了。

  过去开发一个因子耗时很长,因为它需要处理的数据量非常大,但是使用自然语言处理技术,我们可以很快地把这个新因子提炼出来,能够把它准确地表征出来。

关键词阅读:苏宁金融 顾慧君 智能投顾

责任编辑:Robot RF13015
精彩推荐
加载更多
全部评论
金融界App
金融界微博
金融界公众号