感谢 @打新交朋友 兄发起的征文活动和邀请,写这篇回忆虽然花了几天时间,但想到是给自己未来老态龙钟之时留下一份美好回忆,还是非常开心的。今天把文稿发给打新兄了,也在集思录上发一下与大家共勉。
我的一句话简介:90年代考入中国科大,00年代回国IT公司搬砖,后重返象牙塔任教,现为某211大学佛系教授博导。业余投资十余年,收益共计十余倍。主做量化、低风险、套利、低估价值股。
我是2007下半年开始投资生涯的。当时刚留学回国,受到6000点大牛市狂热气氛的感染,稀里糊涂就进了股市。看了几十本炒股的书,这些书鱼龙混杂,很多内容都属于地摊文学性质,看的晕头转向。现在想来这正是投资理财的一大特征:知识体系庞杂,错误理论很多。而一个人是否有能力去伪存真,可以说是决定后期水平的核心要素。我认识一些老股民,可能比较缺乏学习中的思辨习惯,炒股几十年仍然是小道消息流。
我刚入门时缺乏会计学知识和能力,觉得价值分析太难,就看了一些技术分析的书。找到的技术书大都是神棍型,比如一种典型的写法是先给出一个技术指标,再给出一张k线案例,就声称能说明指标有效了;也有一些是以“庄家”为模拟对手,讲一些基于想象力的故事。我对这两类书本能的排斥。但紧接着看了一本《行为金融学》教材,意识到了技术和心理学的关系,发现技术流其实也是有内在逻辑的。于是花了几个月把能找到的技术书籍都看了一遍,提炼了少数我觉得可信的理论,初步形成了一套以趋势和波浪理论为核心的交易体系。
市场中的趋势现象具有心理学基础,主要包括三个原因。(1)获得信息的批次性:一个新信息必定是少数人先获知,后续群体的认知也是逐渐从部分到全体的,这带来一个动量的时间延续。其实这也就是理性回归逻辑流派最怕的东西—黑天鹅。信息获知延迟导致的股价暴跌,你以为是偏离价值越跌越买,其实是你还没获悉的内幕信息早已改变了价值,等你获知了信息早已巨亏。(2)锚定效应时效性:对于某个改变标的定价的新事件,由于过去的锚定心态,人们对变化的接受是缓慢的,这带来一个动量的时间延续(3)羊群心理:随着标的的价格变动,引发了恐慌或者贪婪心理,导致趋势自我强化。
还有一些其他的技术面法则也和心理学有关。比如阻力位、支撑位体现了人的后悔心理,双头、双底心态体现了人的贪婪和恐惧,大整数位体现的是强迫症完美心理,波浪形态体现的是群体情绪的不稳定。等等。
趋势理论认为“牛市不言顶”,于是我用全部的积蓄买了股票,看着股票一直涨,甚至做起了未来财务自由的美梦。好景不长,2008年1月21日这天,我在工作中抽空看了一眼行情,几乎惊呆了:4只持股2只跌停,另2只接近跌停。看着大盘指数如同断头铡刀一样的k线,我脑海中一片空白,但也明白趋势结束了。第二天大盘继续暴跌,我颤抖着双手清仓了全部股票。这两个夜晚,彻夜难眠,五分之一的资产灰飞烟灭,感受到了市场的残酷。这次的当头一棒,让我成了坚决的低风险偏好者。
当时我有一位信仰价值投资的同学,买了七八只股票,其中就包括贵州茅台、烟台万华、万科A、招商银行等现在公认的十年大牛股,也包括晨鸣B、张裕B等低估股票,还有苏宁这个后来遇到降维打击的公司。熊市他也很有信心,并没有卖。这算是我身边人对价值投资真实性的印证,也说明了价值投资成长股并不完全是后视镜。
在2008年大熊市里,我虽然没有持股,但是一直如饥似渴的学习。这期间看了原闽发大V“baiyumi”的一些帖子,受益匪浅,开始重视宏观面。同时也买了一些教材补课,包括《经济学》《货币银行学》《国际金融学》之类,希望能从宏观经济、货币流动等基本面角度补充对“趋势”的认知维度,增加判断可靠性。在查阅了央行历年M2数据之后,我发现中国改革开放以来每10年的广义货币膨胀幅度高达600-800%,愈发坚定了投资保值的观念。
在实操中我把资金分为两块:一部分择时投资企业债,主要思路是在利率周期的顶部阶段,买入长久期高YTM中等评级(当时还是刚兑背景)的国资企业债,在利率周期的底部卖出获取超额收益。当时还没有集思录这样的专业低风险数据网站,我就到海天园、和讯看看数据,不过网站上的YTM公式也不精确,就自己用excel来算。另外一部分资金开通了商品期货和FXSol外汇账户,通过宏观面和技术面选择具有中长期大趋势的品种,再根据波浪理论分散进行中线操作。做了近一年,账户资金翻倍了,但是感觉波动很大,而且比较占用时间精力,思考再三后还是放弃了这条路。当时的打新无需持股,风险极低,年化20%收益率,我又把资金用于打新。
2009年我从工作的创业公司放弃了股权辞职,进入大学当了一名教师。原公司一直筹备上市,但十年后才踏入A股。对宏观经济的学习也让我开始重视房地产投资。决定退出期货外汇市场后,我自己做了一个房地产分析:(1)改革开放20多年的实际通胀(参考GDP平减指数)约10%,房价涨幅直接受到通胀率加成。(2)改革开放20多年的实际GDP约10%。我认为,虽然黄金和美元资产也可以对冲中国的高通胀,但无法享受GDP增益。(3)中国城市化才进行一半。改革开放前的中国是农业社会,农村人口高达90%,而一个正常的工业社会农村人口低于20%。改革开放20多年,每年约有1%的农村人口变为城市人口(按户籍算,不按户籍算会略多但不超过2%),这个进程未来还将继续30年。(4)中国的人口曲线。70年代是中国第一个生育高峰,90年代初是第二个,从1995开始中国进入人口低谷。90后对应的刚需房是2010-2020年。(5)中国老百姓的人均住房面积和日本人均50+平米还有很大差距,和欧美差距更大,未来会逐渐修复。按照10亿城镇人口人均40平米保守计算,需要400亿平米,而2009年的城镇住房存量只有200亿平米,这还是已经包含小产权的数据,远远不够。
其实房价泡沫的看法早在2000年前后就开始了,很少有人想到房价会像后来那样长牛。2009-2010是房价小低谷,但父母当时都认为房价还得继续跌。我经过分析之后觉得比较有把握,在2009-2012年间陆续买了三套房。其中还有过买商铺的想法,已经看了二三十个临街门面和商场摊位,但宏观调研后觉得未来电商会形成很大冲击,悬崖勒马没买商铺。
2013年之后我放在投资研究上的精力少了些,一是因为职业发展进入了关键阶段。二是开始在健康上投入了一些时间,开始自学一些医学、营养学和健康方面的专业知识,每天坚持30分钟有氧、30分钟无氧运动,合理均衡膳食营养。三是后来孩子出生也投入了大量时间精力。
2016年开始自学量化投资。其实量化我以前也了解过,因为有几个同学留学后没回国,在华尔街投行做量化交易,其中一个同学2012年找我玩时,说量化投资在美国很主流,但当时没有引起重视。2016年国内的大数据平台已经不少了,有了清洗好的数据源,我有一些编程能力,于是就新学了python,看了《金融工程学》《金融计量学》《时间序列分析》等书籍,还看了一些量化交易入门书籍。同时也在互联网平台做了一年的回测,开发了一些收益率和夏普都不错的策略。为了省心,我又自己开发了基于python的自动化交易平台,购买了服务器,开始全自动交易。总的来看,开始量化交易至今跑赢了大盘不少,而且阿尔法超额收益比较稳定,还是很满意的。
之前和在美国做量化同学聊天时,他说策略的开发建议以数据挖掘为主,这样容易找到别人不知道的策略,避免恶性竞争。不过我数学能力不是很好,也不太喜欢纯数据挖掘开发的量化策略,机器学习类的更不喜欢,主要是觉得没有底层逻辑不放心,而且纯数据挖掘会面临市场环境变化的问题,不如拥有底层逻辑的策略稳定。目前我用的量化策略都是具有严密底层逻辑的,在此基础上再进行回测。
说到回测,其实论坛上很多业余量化投资者的回测是比较粗糙的,其中一个非常普遍的问题,就是简单用过去N年的数据调参,获得一个最优就完了,就上实盘了。这种做法很容易导致过拟合,实盘之后发现远低于回测的收益。严肃的回测应该分开训练段和检测段,比如手头有2010-2019年的市场数据,优化参数是只用2010-2017的数据,优化完后用2018-2019年的数据来检验策略,如果策略在2018-2019年的超额阿尔法明显低于2010-2017,那就说明策略可能有问题,这种概念在专业人士眼里应该是常识,但业余量化投资者可能会忽略,我也是看了书才知道。其他需要注意的回测误区还有很多,回测的科学性也是一门不简单的学问。
再比如我一直学习F大的银行量化轮动策略,看到F大在实盘许多年后发帖说,他新发现除了他实盘用的大阈值外,还有个小阈值也很有效。其实这也是一个策略开发中的常见的问题。如果在调参优化的时候采用纯手动,又有多个参数需要调节,很容易出现参数盲区,因为每一个参数对策略性能的影响未必是单调的,可能存在局部高峰或低谷。应对办法是在回测时采用自动化的多维正交调参,可以扫描出所有的参数正交点,这个工作量很大无法人工执行,必须开发专门的调参程序来做。
第一次发帖后回复中比较多朋友对量化回测的规范性感兴趣,再补充两个回测可能需要注意的小细节:首先是策略性能的单调性。也就是按照策略的评分把所有标的分为N组,看看他们的阿尔法是否单调增加。如果不是,说明策略的内在逻辑不够普适,可能存疑。然后是策略性能的稳定性。对每一个回测小周期进行有效性分析,评估阿尔法收益是稳定的呢,还是来自于少数几次大爆发。稳定的可靠性更好。这个可以用程序统计,也可以参考一些预测性的评估指标如信息系数IC(Information Coefficient)、信息比率IR(Information Ratio)。有的互联网回测平台也提供了直接显示的方便服务,比如果仁。
在对回测理论的认识加深了之后,我反思了当初对趋势技术交易体系的认识,最后我放弃了它。为什么呢?大量回测告诉我,趋势技术交易在回测中很容易就有非常优异的表现,但其实主要是过拟合带来的。不仅如此,趋势技术的超额收益“稳定性”其实是非常差的。信仰趋势的人都知道“不要预测市场,跟随市场,执行交易计划即可”这句老话。我以前也觉得这句话很客观,后来醒悟到这句话其实隐藏了许多的主观因素,甚至可以说是一碗鸡汤。虽然看似不预测走势的顶和底绝对高度,但实际上对频率、信噪比等一些隐藏参数进行了预测。预测这些参数和预测顶底高度没有本质区别。这些预测的参数如何确定?也都是基于历史样本,但我认为这些参数并不可靠。
为什么不可靠呢?因为趋势交易方法的主要收益来自于几年一次的大周期波动,往往整个市场历史上也就包括三五次这种大周期波动。从统计学角度来看这是典型的小样本结论,小样本结论的可靠性是很差的。我用趋势理论做过大量回测,同品种不同时段的最优参数天差地别,因为小样本下特别容易产生过拟合。在这些反思之后,我意识到趋势理论虽然有其心理学基础,但主要应该用于指导交易哲学,让我们不要低估恐惧和贪婪的狂热情绪,但不合适用来构建具体的量化策略。与之相反,一些高频的量化交易虽然在常人眼中就是送手续费,但如果能把手续费谈的很低,控制资金容量不形成大的冲击成本的话,反而是基于大样本的可靠策略。
在我的量化方法论中,策略开发完成后,还会继续利用历史大数据,对策略进行一些其它分析。经过这些比较多可靠性检测工作,我目前开发的几个量化策略,实盘和回测的阿尔法超额收益基本没有区别,也比较稳定。我现在用的量化策略主要分为三类:一是特定行业的股票低估值轮动,二是小容量的反人性交易策略,三是程序实时监控的自动化套利。
目前对于(一)特定行业的股票低估值轮动中,我投入资金较多的是房地产行业。近几年地产被资本市场认为已经进入夕阳阶段,因此估值只有8-10倍PE,是全A股大板块中倒数第二低的,仅高于银行板块。但其实地产的ROE仍然很高,超过了15%,银行只有11%。尤其是地产的预售制度让其锁定了未来两年的利润,可以预判出两年后的行业PE不到4倍。地产虽然已过巅峰,但我认为这个估值还是太低了。通常4倍PE对应的是即将中止经营的行业,比如快枯竭的矿产。房价下跌是一个需要关注的问题,但土地增值税一定程度上也能缓冲和平滑这个问题。另一方面,地产行业的集中度非常低,头部企业还有很大增长空间,以龙头企业市场占有率为例,地产不到5%,白酒、保险约20%,家电约30%。因此我认为龙头房企的黄金期还能持续许多年。
由于地产行业可以通过预售和土储推测利润,因此我对地产行业进行量化没有基于当前PB、PE、ROE数值,而是在对企业经营层面把关的基础上排除了80%的房地产企业,对优选后的企业,采用基于销售数据的前瞻PE估值方法,并结合企业经营模式来估值排序。这个方法从理论上不难,就是利用预售数据估算前瞻营业收入,再预测前瞻利润,再用经营模式、运作效率、土储成本、土储货值、货币化资产、企业融资情况修正前瞻利润,最后排名。这些逻辑雪球上有不少大V研究的很透了,比如小兵009等,我也一直在学习。我2018年买入奥园后持仓一年翻倍,买入新城后先是大涨但由于董事长猥亵幼女被抓又迎来好几个跌停板。后来进一步分散,目前持有恒大、融创、融信等港股,和新城、蓝光、荣盛、阳光城等A股。
2017年我用网名“盛唐风物”在集思录上发过一个转债量化轮动算法:
https://www.jisilu.cn/question/256469 收到了较多网友的关注。这个算法考虑了转债的到期、回售、正常转股认购、下修转股期权、强赎认购损失等几乎所有和转债相关的因素。这个算法有两个优点,一是比较全面的考虑了可转债的内涵价值,精度比我在论坛上看到的各种转债估值方法应该都要好些;二是电脑运算量可以接受,在服务器上10秒钟内就能算出轮动排序,可以用于实际交易。
但这个轮动方法也有缺点,就是可转债的内涵价值回归比较慢。从根源上说,证券投资收益有两个来源,一是内含价值增长,二是市场错误估值的回归。例如轮动分级A,内含价值增长就是修正收益率,4%的A比3%的A内含价值增长要高。但是,4%的未必比3%的轮动总收益率高。这是因为3%的数量多,市场错误估值回归更频繁,回归收益率更高。上面说的转债量化算法,虽然能选出内含价值增长潜力最大的转债,但存在回归较慢的缺点。后来我又开发了一个重视回归速度的转债量化算法,但阿尔法的稳定性不强。
回归收益率是“市场有效性”的体现,在一个完全有效市场中,回归收益率为0,投资者只能靠内含价值增长盈利。做轮动的应该都有这个体会:牛市来了,韭菜多了,市场有效性降低了,轮动切换频繁了,回归收益率暴涨。做套利和准套利,其实就是试图获取确定性很大的回归收益率,但正因为确定性很大,套利资金飞速涌入,超额收益率就没了。这也就是2017-2019年集思录大家常说的套利荒。
有的时候,虽然没有资金竞争,但机会也可能因为市场环境变化而消失。比如今年我发现了一个非主流的套利机会,流程比较繁琐,有些像皮董们网下打新那种感觉。根据我的观察全市场应该只有我一个人在做,快一个月利润6%的样子,我本来以为能做很久,但其实一个月后空间就没了。下来思考,我觉得这也是市场的自修复特性,即使没有直接竞争资金,但还有许多其它动机的资金在不经意的流动也会趋向于抹平套利空间。
2018年我开始学习传统价值投资,开始关注三大报表之外的东西。这也是基于上述考虑。传统价值投资可以说是一种确定性低、难于套利、人脑不容易被AI取代的投资模式。正因为如此,其中的超额收益可以长期存在,这也是传统价值投资经历百年而不衰的原因。同时,蓝筹股通常有10+%的内含价值增长,固定收益投资通常只有5%左右的内含价值增长。我的看法是:价值投资是基础,是能长期跑赢通胀的的投资体系;固定收益投资是补充,用于宏观周期中某些特定阶段,但如果以固定收益投资作为超长期主仓,可能反而是一种高风险;套利是奇兵,能达成低风险高收益,虽然机会往往不可能长期维持,但时不时找机会套一把,能明显提高总收益率。孙子兵法说的“以正合,以奇胜”我觉得也可以用于投资理念,上大学时我一个同学写过首词,我觉得不错,和大家分享一下:
以正治国,滔滔楚雾迷南北。
以奇用兵,渭水平原坠大星。
奇中有正,十面伏师止楚奋。
正也出奇,杯酒能教上将离。
往事说完,再说说未来。我现在关注的是将传统价投和量化结合,在考虑行业特点和企业经营模式的基础上设计量化评价体系,用更丰富的数据(三大报表之外的数据,尤其是前瞻性数据)来作为量化输入源,将人脑主观认知和量化客观评价结合,争取获得长期有效的阿尔法。将传统价投和量化结合还有一个优点,就是工作量比纯人工小,持仓可以相对分散(我一般是持有十只以上的股票),对黑天鹅抵抗力强。缺点呢,就是研究深度不够,收益率可能没有杰出的价值投资者那么高,不过我是愿意为了低风险接受这种低收益的。目前这一模式我已经用在了房地产股票实盘中。
最后说说风险控制。我是一个典型的低风险投资者,这么多年下来,我的风险控制可以提炼为三原则:(1)金融市场上尽量不用杠杆,特别有把握时融资不超过20%。(2)分散投资,单个大类品种不超过70%仓位,单个标的不超过10%仓位。(3)重视资本市场外的经营积累,比如健康、职业、家人、朋友、知识和修养,这些不仅提供了资本市场外另一些维度的保障,而且能带来除了钱之外的其他幸福感。
最近,我新建了公众号“盛唐风物”。希望能:筑一方宁静室,与众友聊投资。一点投资方法,少许理财感悟。探究财富之钥,并肩人生之旅。
我的一句话简介:90年代考入中国科大,00年代回国IT公司搬砖,后重返象牙塔任教,现为某211大学佛系教授博导。业余投资十余年,收益共计十余倍。主做量化、低风险、套利、低估价值股。
我是2007下半年开始投资生涯的。当时刚留学回国,受到6000点大牛市狂热气氛的感染,稀里糊涂就进了股市。看了几十本炒股的书,这些书鱼龙混杂,很多内容都属于地摊文学性质,看的晕头转向。现在想来这正是投资理财的一大特征:知识体系庞杂,错误理论很多。而一个人是否有能力去伪存真,可以说是决定后期水平的核心要素。我认识一些老股民,可能比较缺乏学习中的思辨习惯,炒股几十年仍然是小道消息流。
我刚入门时缺乏会计学知识和能力,觉得价值分析太难,就看了一些技术分析的书。找到的技术书大都是神棍型,比如一种典型的写法是先给出一个技术指标,再给出一张k线案例,就声称能说明指标有效了;也有一些是以“庄家”为模拟对手,讲一些基于想象力的故事。我对这两类书本能的排斥。但紧接着看了一本《行为金融学》教材,意识到了技术和心理学的关系,发现技术流其实也是有内在逻辑的。于是花了几个月把能找到的技术书籍都看了一遍,提炼了少数我觉得可信的理论,初步形成了一套以趋势和波浪理论为核心的交易体系。
市场中的趋势现象具有心理学基础,主要包括三个原因。(1)获得信息的批次性:一个新信息必定是少数人先获知,后续群体的认知也是逐渐从部分到全体的,这带来一个动量的时间延续。其实这也就是理性回归逻辑流派最怕的东西—黑天鹅。信息获知延迟导致的股价暴跌,你以为是偏离价值越跌越买,其实是你还没获悉的内幕信息早已改变了价值,等你获知了信息早已巨亏。(2)锚定效应时效性:对于某个改变标的定价的新事件,由于过去的锚定心态,人们对变化的接受是缓慢的,这带来一个动量的时间延续(3)羊群心理:随着标的的价格变动,引发了恐慌或者贪婪心理,导致趋势自我强化。
还有一些其他的技术面法则也和心理学有关。比如阻力位、支撑位体现了人的后悔心理,双头、双底心态体现了人的贪婪和恐惧,大整数位体现的是强迫症完美心理,波浪形态体现的是群体情绪的不稳定。等等。
趋势理论认为“牛市不言顶”,于是我用全部的积蓄买了股票,看着股票一直涨,甚至做起了未来财务自由的美梦。好景不长,2008年1月21日这天,我在工作中抽空看了一眼行情,几乎惊呆了:4只持股2只跌停,另2只接近跌停。看着大盘指数如同断头铡刀一样的k线,我脑海中一片空白,但也明白趋势结束了。第二天大盘继续暴跌,我颤抖着双手清仓了全部股票。这两个夜晚,彻夜难眠,五分之一的资产灰飞烟灭,感受到了市场的残酷。这次的当头一棒,让我成了坚决的低风险偏好者。
当时我有一位信仰价值投资的同学,买了七八只股票,其中就包括贵州茅台、烟台万华、万科A、招商银行等现在公认的十年大牛股,也包括晨鸣B、张裕B等低估股票,还有苏宁这个后来遇到降维打击的公司。熊市他也很有信心,并没有卖。这算是我身边人对价值投资真实性的印证,也说明了价值投资成长股并不完全是后视镜。
在2008年大熊市里,我虽然没有持股,但是一直如饥似渴的学习。这期间看了原闽发大V“baiyumi”的一些帖子,受益匪浅,开始重视宏观面。同时也买了一些教材补课,包括《经济学》《货币银行学》《国际金融学》之类,希望能从宏观经济、货币流动等基本面角度补充对“趋势”的认知维度,增加判断可靠性。在查阅了央行历年M2数据之后,我发现中国改革开放以来每10年的广义货币膨胀幅度高达600-800%,愈发坚定了投资保值的观念。
在实操中我把资金分为两块:一部分择时投资企业债,主要思路是在利率周期的顶部阶段,买入长久期高YTM中等评级(当时还是刚兑背景)的国资企业债,在利率周期的底部卖出获取超额收益。当时还没有集思录这样的专业低风险数据网站,我就到海天园、和讯看看数据,不过网站上的YTM公式也不精确,就自己用excel来算。另外一部分资金开通了商品期货和FXSol外汇账户,通过宏观面和技术面选择具有中长期大趋势的品种,再根据波浪理论分散进行中线操作。做了近一年,账户资金翻倍了,但是感觉波动很大,而且比较占用时间精力,思考再三后还是放弃了这条路。当时的打新无需持股,风险极低,年化20%收益率,我又把资金用于打新。
2009年我从工作的创业公司放弃了股权辞职,进入大学当了一名教师。原公司一直筹备上市,但十年后才踏入A股。对宏观经济的学习也让我开始重视房地产投资。决定退出期货外汇市场后,我自己做了一个房地产分析:(1)改革开放20多年的实际通胀(参考GDP平减指数)约10%,房价涨幅直接受到通胀率加成。(2)改革开放20多年的实际GDP约10%。我认为,虽然黄金和美元资产也可以对冲中国的高通胀,但无法享受GDP增益。(3)中国城市化才进行一半。改革开放前的中国是农业社会,农村人口高达90%,而一个正常的工业社会农村人口低于20%。改革开放20多年,每年约有1%的农村人口变为城市人口(按户籍算,不按户籍算会略多但不超过2%),这个进程未来还将继续30年。(4)中国的人口曲线。70年代是中国第一个生育高峰,90年代初是第二个,从1995开始中国进入人口低谷。90后对应的刚需房是2010-2020年。(5)中国老百姓的人均住房面积和日本人均50+平米还有很大差距,和欧美差距更大,未来会逐渐修复。按照10亿城镇人口人均40平米保守计算,需要400亿平米,而2009年的城镇住房存量只有200亿平米,这还是已经包含小产权的数据,远远不够。
其实房价泡沫的看法早在2000年前后就开始了,很少有人想到房价会像后来那样长牛。2009-2010是房价小低谷,但父母当时都认为房价还得继续跌。我经过分析之后觉得比较有把握,在2009-2012年间陆续买了三套房。其中还有过买商铺的想法,已经看了二三十个临街门面和商场摊位,但宏观调研后觉得未来电商会形成很大冲击,悬崖勒马没买商铺。
2013年之后我放在投资研究上的精力少了些,一是因为职业发展进入了关键阶段。二是开始在健康上投入了一些时间,开始自学一些医学、营养学和健康方面的专业知识,每天坚持30分钟有氧、30分钟无氧运动,合理均衡膳食营养。三是后来孩子出生也投入了大量时间精力。
2016年开始自学量化投资。其实量化我以前也了解过,因为有几个同学留学后没回国,在华尔街投行做量化交易,其中一个同学2012年找我玩时,说量化投资在美国很主流,但当时没有引起重视。2016年国内的大数据平台已经不少了,有了清洗好的数据源,我有一些编程能力,于是就新学了python,看了《金融工程学》《金融计量学》《时间序列分析》等书籍,还看了一些量化交易入门书籍。同时也在互联网平台做了一年的回测,开发了一些收益率和夏普都不错的策略。为了省心,我又自己开发了基于python的自动化交易平台,购买了服务器,开始全自动交易。总的来看,开始量化交易至今跑赢了大盘不少,而且阿尔法超额收益比较稳定,还是很满意的。
之前和在美国做量化同学聊天时,他说策略的开发建议以数据挖掘为主,这样容易找到别人不知道的策略,避免恶性竞争。不过我数学能力不是很好,也不太喜欢纯数据挖掘开发的量化策略,机器学习类的更不喜欢,主要是觉得没有底层逻辑不放心,而且纯数据挖掘会面临市场环境变化的问题,不如拥有底层逻辑的策略稳定。目前我用的量化策略都是具有严密底层逻辑的,在此基础上再进行回测。
说到回测,其实论坛上很多业余量化投资者的回测是比较粗糙的,其中一个非常普遍的问题,就是简单用过去N年的数据调参,获得一个最优就完了,就上实盘了。这种做法很容易导致过拟合,实盘之后发现远低于回测的收益。严肃的回测应该分开训练段和检测段,比如手头有2010-2019年的市场数据,优化参数是只用2010-2017的数据,优化完后用2018-2019年的数据来检验策略,如果策略在2018-2019年的超额阿尔法明显低于2010-2017,那就说明策略可能有问题,这种概念在专业人士眼里应该是常识,但业余量化投资者可能会忽略,我也是看了书才知道。其他需要注意的回测误区还有很多,回测的科学性也是一门不简单的学问。
再比如我一直学习F大的银行量化轮动策略,看到F大在实盘许多年后发帖说,他新发现除了他实盘用的大阈值外,还有个小阈值也很有效。其实这也是一个策略开发中的常见的问题。如果在调参优化的时候采用纯手动,又有多个参数需要调节,很容易出现参数盲区,因为每一个参数对策略性能的影响未必是单调的,可能存在局部高峰或低谷。应对办法是在回测时采用自动化的多维正交调参,可以扫描出所有的参数正交点,这个工作量很大无法人工执行,必须开发专门的调参程序来做。
第一次发帖后回复中比较多朋友对量化回测的规范性感兴趣,再补充两个回测可能需要注意的小细节:首先是策略性能的单调性。也就是按照策略的评分把所有标的分为N组,看看他们的阿尔法是否单调增加。如果不是,说明策略的内在逻辑不够普适,可能存疑。然后是策略性能的稳定性。对每一个回测小周期进行有效性分析,评估阿尔法收益是稳定的呢,还是来自于少数几次大爆发。稳定的可靠性更好。这个可以用程序统计,也可以参考一些预测性的评估指标如信息系数IC(Information Coefficient)、信息比率IR(Information Ratio)。有的互联网回测平台也提供了直接显示的方便服务,比如果仁。
在对回测理论的认识加深了之后,我反思了当初对趋势技术交易体系的认识,最后我放弃了它。为什么呢?大量回测告诉我,趋势技术交易在回测中很容易就有非常优异的表现,但其实主要是过拟合带来的。不仅如此,趋势技术的超额收益“稳定性”其实是非常差的。信仰趋势的人都知道“不要预测市场,跟随市场,执行交易计划即可”这句老话。我以前也觉得这句话很客观,后来醒悟到这句话其实隐藏了许多的主观因素,甚至可以说是一碗鸡汤。虽然看似不预测走势的顶和底绝对高度,但实际上对频率、信噪比等一些隐藏参数进行了预测。预测这些参数和预测顶底高度没有本质区别。这些预测的参数如何确定?也都是基于历史样本,但我认为这些参数并不可靠。
为什么不可靠呢?因为趋势交易方法的主要收益来自于几年一次的大周期波动,往往整个市场历史上也就包括三五次这种大周期波动。从统计学角度来看这是典型的小样本结论,小样本结论的可靠性是很差的。我用趋势理论做过大量回测,同品种不同时段的最优参数天差地别,因为小样本下特别容易产生过拟合。在这些反思之后,我意识到趋势理论虽然有其心理学基础,但主要应该用于指导交易哲学,让我们不要低估恐惧和贪婪的狂热情绪,但不合适用来构建具体的量化策略。与之相反,一些高频的量化交易虽然在常人眼中就是送手续费,但如果能把手续费谈的很低,控制资金容量不形成大的冲击成本的话,反而是基于大样本的可靠策略。
在我的量化方法论中,策略开发完成后,还会继续利用历史大数据,对策略进行一些其它分析。经过这些比较多可靠性检测工作,我目前开发的几个量化策略,实盘和回测的阿尔法超额收益基本没有区别,也比较稳定。我现在用的量化策略主要分为三类:一是特定行业的股票低估值轮动,二是小容量的反人性交易策略,三是程序实时监控的自动化套利。
目前对于(一)特定行业的股票低估值轮动中,我投入资金较多的是房地产行业。近几年地产被资本市场认为已经进入夕阳阶段,因此估值只有8-10倍PE,是全A股大板块中倒数第二低的,仅高于银行板块。但其实地产的ROE仍然很高,超过了15%,银行只有11%。尤其是地产的预售制度让其锁定了未来两年的利润,可以预判出两年后的行业PE不到4倍。地产虽然已过巅峰,但我认为这个估值还是太低了。通常4倍PE对应的是即将中止经营的行业,比如快枯竭的矿产。房价下跌是一个需要关注的问题,但土地增值税一定程度上也能缓冲和平滑这个问题。另一方面,地产行业的集中度非常低,头部企业还有很大增长空间,以龙头企业市场占有率为例,地产不到5%,白酒、保险约20%,家电约30%。因此我认为龙头房企的黄金期还能持续许多年。
由于地产行业可以通过预售和土储推测利润,因此我对地产行业进行量化没有基于当前PB、PE、ROE数值,而是在对企业经营层面把关的基础上排除了80%的房地产企业,对优选后的企业,采用基于销售数据的前瞻PE估值方法,并结合企业经营模式来估值排序。这个方法从理论上不难,就是利用预售数据估算前瞻营业收入,再预测前瞻利润,再用经营模式、运作效率、土储成本、土储货值、货币化资产、企业融资情况修正前瞻利润,最后排名。这些逻辑雪球上有不少大V研究的很透了,比如小兵009等,我也一直在学习。我2018年买入奥园后持仓一年翻倍,买入新城后先是大涨但由于董事长猥亵幼女被抓又迎来好几个跌停板。后来进一步分散,目前持有恒大、融创、融信等港股,和新城、蓝光、荣盛、阳光城等A股。
2017年我用网名“盛唐风物”在集思录上发过一个转债量化轮动算法:
https://www.jisilu.cn/question/256469 收到了较多网友的关注。这个算法考虑了转债的到期、回售、正常转股认购、下修转股期权、强赎认购损失等几乎所有和转债相关的因素。这个算法有两个优点,一是比较全面的考虑了可转债的内涵价值,精度比我在论坛上看到的各种转债估值方法应该都要好些;二是电脑运算量可以接受,在服务器上10秒钟内就能算出轮动排序,可以用于实际交易。
但这个轮动方法也有缺点,就是可转债的内涵价值回归比较慢。从根源上说,证券投资收益有两个来源,一是内含价值增长,二是市场错误估值的回归。例如轮动分级A,内含价值增长就是修正收益率,4%的A比3%的A内含价值增长要高。但是,4%的未必比3%的轮动总收益率高。这是因为3%的数量多,市场错误估值回归更频繁,回归收益率更高。上面说的转债量化算法,虽然能选出内含价值增长潜力最大的转债,但存在回归较慢的缺点。后来我又开发了一个重视回归速度的转债量化算法,但阿尔法的稳定性不强。
回归收益率是“市场有效性”的体现,在一个完全有效市场中,回归收益率为0,投资者只能靠内含价值增长盈利。做轮动的应该都有这个体会:牛市来了,韭菜多了,市场有效性降低了,轮动切换频繁了,回归收益率暴涨。做套利和准套利,其实就是试图获取确定性很大的回归收益率,但正因为确定性很大,套利资金飞速涌入,超额收益率就没了。这也就是2017-2019年集思录大家常说的套利荒。
有的时候,虽然没有资金竞争,但机会也可能因为市场环境变化而消失。比如今年我发现了一个非主流的套利机会,流程比较繁琐,有些像皮董们网下打新那种感觉。根据我的观察全市场应该只有我一个人在做,快一个月利润6%的样子,我本来以为能做很久,但其实一个月后空间就没了。下来思考,我觉得这也是市场的自修复特性,即使没有直接竞争资金,但还有许多其它动机的资金在不经意的流动也会趋向于抹平套利空间。
2018年我开始学习传统价值投资,开始关注三大报表之外的东西。这也是基于上述考虑。传统价值投资可以说是一种确定性低、难于套利、人脑不容易被AI取代的投资模式。正因为如此,其中的超额收益可以长期存在,这也是传统价值投资经历百年而不衰的原因。同时,蓝筹股通常有10+%的内含价值增长,固定收益投资通常只有5%左右的内含价值增长。我的看法是:价值投资是基础,是能长期跑赢通胀的的投资体系;固定收益投资是补充,用于宏观周期中某些特定阶段,但如果以固定收益投资作为超长期主仓,可能反而是一种高风险;套利是奇兵,能达成低风险高收益,虽然机会往往不可能长期维持,但时不时找机会套一把,能明显提高总收益率。孙子兵法说的“以正合,以奇胜”我觉得也可以用于投资理念,上大学时我一个同学写过首词,我觉得不错,和大家分享一下:
以正治国,滔滔楚雾迷南北。
以奇用兵,渭水平原坠大星。
奇中有正,十面伏师止楚奋。
正也出奇,杯酒能教上将离。
往事说完,再说说未来。我现在关注的是将传统价投和量化结合,在考虑行业特点和企业经营模式的基础上设计量化评价体系,用更丰富的数据(三大报表之外的数据,尤其是前瞻性数据)来作为量化输入源,将人脑主观认知和量化客观评价结合,争取获得长期有效的阿尔法。将传统价投和量化结合还有一个优点,就是工作量比纯人工小,持仓可以相对分散(我一般是持有十只以上的股票),对黑天鹅抵抗力强。缺点呢,就是研究深度不够,收益率可能没有杰出的价值投资者那么高,不过我是愿意为了低风险接受这种低收益的。目前这一模式我已经用在了房地产股票实盘中。
最后说说风险控制。我是一个典型的低风险投资者,这么多年下来,我的风险控制可以提炼为三原则:(1)金融市场上尽量不用杠杆,特别有把握时融资不超过20%。(2)分散投资,单个大类品种不超过70%仓位,单个标的不超过10%仓位。(3)重视资本市场外的经营积累,比如健康、职业、家人、朋友、知识和修养,这些不仅提供了资本市场外另一些维度的保障,而且能带来除了钱之外的其他幸福感。
最近,我新建了公众号“盛唐风物”。希望能:筑一方宁静室,与众友聊投资。一点投资方法,少许理财感悟。探究财富之钥,并肩人生之旅。