在阿布量化报告中有一个模块叫做AI预测涨跌幅, 如下:
很多用户不太明白这个这个预测有什么用, 有些人说: 不太准!, 有些人说: 这就是瞎猜吧, 首先来回答一下:
下面将分两部分阐述并证明上面的回答
这个可以理解为比如使用AI大数据预测中预测的分数
那样比如我在选股的时候我会优选选择概率优势大的股票, 但是这样比如你在周一的时候进行买入, 周五的时候进行卖出, 就能以这样的概率获胜吗? 这需要综合考虑下面几点:
关于AI大数据预测分数的概率优势将再在本文后续章节证明.
实际上现在所有的人工智能都是属于弱人工智能,但alphago vs 柯洁和阿法狗战胜围棋冠军李世石, 是因为根据围棋规则计算机构建学习网络,使用强大运算能力通过蒙特卡洛寻找最优,俗话说3个臭皮匠顶一个诸葛亮,它运行的本质就是每走一步棋都依靠成千上万个臭皮匠(臭棋篓子)朝各种可能性走一步,然后从它们走出的结果中选取最好的那一个臭棋篓子上场,这个被选中的臭棋篓子和其它臭棋篓子没有任何区别,它只是幸运的走了最好的那一步,它的本质是多个弱人工智能效力叠加,通过游戏规则取胜,所以与其说是阿法狗大战李世石, 不如叫做十万个臭棋篓子大战李世石
相同的道理在机器必定无法在真实智力上胜过人类的前提前下, 量化最大的技术诉求是优势的叠加, 也就是上面的弱人工智能效力叠加
实现这个技术诉求的最有效直接的方式是在上面最初第一条量化最大的自身光环是高数据量的无差别分析的基础上, 最大限度提升上面第二条的单维度概率优势, 由于可以对市场中大量的股票进行多维度量化度量, 这样就可以综合多个维度的量化结果进行概率优势的叠加, 这样子的叠加的结果只是极微弱的, 并且有些量化类型的概率优势本身就是很微弱的, 但是这些特性类型的量化维度, 是可以作为叠加辅助的优良选择.
回归本文正题, 本文主旨是通过数据和实际案例来证明AI预测涨跌幅是否存在概率优势, 首先下面做一个完全靠乱猜涨跌幅的概率模型.
定假股票每天的涨跌幅区间是-10%到+10%, 以0.01个点为1个单位, 那么这个序列为:
[-10. , -9.99, -9.98, ..., 9.97, 9.98, 9.99]
这个序列就的数量一共是2000个, 如果假定每一种涨跌幅的概率是相同的那么涨停+10%的概率将是: 1/2000, 跌停的概率同样也是 1/2000.
这是一个很小的概率, 北京2018年5月份之前小汽车牌照指标的中签率大概就是这个概率, 可以体会一下多小, 你猜自己能在下一个月摇上号结果真中了, 和你猜一个股票明天涨停它就真涨停了的概率是基本相同的.
下面对将完全靠猜涨跌幅各个维度技术概率进行简单计算:
按照这个概率来说, 继续举例使用北京小汽车牌照指标的中签率, 就是家里有5口人都参加了摇号, 连续5期, 每一期一个人摇号中签, 最后家里人都中签了..
如果以猜测的差不多范围内就也算成功, 这个概率就会提高一些, 但是由于这个模型本身 就是为了简单, 且每天的涨跌幅区间范围-10%到+10%也是大大的留情, 实际的预测的时候 并没有范围这个概念, 实际预测的时候也没有10%作为极限进行预测, 都是使用负无穷->正无穷, 预测模型并没有对有涨跌停板干预的市场做特殊处理
在APP发现页面中有一项叫做AI涨跌幅适应度, 其记录的是上一周报告AI预测涨跌幅走势和实际走势的适应度, 也可理解为成功预测.
由于算力设备有限, 所以暂时沪深和美股市场的周报只做1900个股票分析量化, 即只有1900个可以评测适应度, 用户可以在周末周报出来后进行查看
对于大数据对涨跌幅进行预测, 最关键的不是最后的涨跌幅度能不能相同, 有几个交易日预测准确, 走势是否完美相关, 更重要的是关键特征是否一致, 特征滞后或者超前的容忍等等, 比如下面几个示例虽然最后的偏差存在, 但在适应度度量中分数依然会比较高:
对于整个系统来说, 适应度分数大于一定分数的可以理解为成功预测, 那么每一周AI预测涨跌幅的成功预测比例是多少呢
由于金融市场的特殊性, 特别是受整个市场氛围的变化特性, 所以有些批次的成功率偏低, 但有些批次的成功率很高, 但综合更多次的平均, 这个值的概率大概是13%上下, 这个概率优势高吗? 确实不高, 100个里面有13个能预测满意的, 因为这个预测不是猜涨跌类型的二分离散猜测, 而是连续值概率分布问题, 没有那么高的自然优势概率, 它属于微概率优势量化.
备注:
微概率优势是不能作为主策略去进行交易使用的, 因为总体概率优势并不高, 但是可以做为辅助叠加策略进行使用, 上面说的第三条量化最大的技术诉求是优势的叠加, 举例如下:
本文这里只是先简单说明微概率优势的作用, 后续章节后有更专门的使用实例.