量化策略复杂,难以用简单语言解释清楚,且量化人员多为理工科背景,不擅长表达。
A股量化投资大约有20年历史,始于2004年光大保德信基金的量化核心公募基金。
经历了三个阶段:1.0基于规则的基本面量化选股,2.0系统化投资,3.0算法交易和机器学习。
因子是具体的投资逻辑,需要用历史数据检验其有效性,如低估值股票可能带来超额收益。
公募基金交易系统必须通过O32联合风控系统,限制了高频交易的使用。
量化基金经理主要关注阿尔法(超额收益),认为阿尔法等于能力乘以宽度的平方根。
红利增强策略重视上市公司分红金额的可持续性,通过量化方法对分红可持续性建模。
选择时应考虑超额收益的长期有效性和基金公司的量化布局,以及团队的经验和业绩。
典型的一天包括晨会、查看产品表现、策略研发、交易执行和客户交流。
先简单介绍一下你的经历我算是量化的一个老兵了 2010 年博士毕业回国在光大宝道信基金从 2010 年到 2018 年 2018 年到去年在华欣证券支管
去年来的行权我大概是 2013 年就开始管资金大概情况这样的其实路过几个量化的基金经理一开始对这个挺有期待的但后来发现普遍有点困难就这个事似乎没办法说得太轻说太清楚有点像晾底裤了
但是说不太清楚的话大家可能又觉得这个事本身就有点抽象然后又挺黑盒的我并不是这样觉得的我觉得量化的话应该帮他做得更加透明化因为这样的话我们的量化行业才能够做起来量化的话他比较会设其实一些基本的原理可能很多朋友还不是很了解是需要科普的
至于它的核心的地方坦率来说它是比较复杂的甚至有些模型我就敞开给你看代码如果你不是那种非常专业的你也不一定能看得懂但是不管怎么说的话我觉得为了量化行业的整体的发展我们还是要用一些直白的语言去把那个量化的基本的原理表述清楚我觉得可能是有一个问题量化它确实是比较的拗口一点相对来说同时
做量化的人吧都是做一些理工科的可能也不是那么善于或希望去表达这也是一个原因
或者大家的预设就是我说了你也不一定能太听得懂因为大家想法很简单我们量化靠业绩特别是量化拭目你看他的创始人其实都很年轻但是呢我就靠业绩就可以了业绩就是我最好的宣传所以他不需要帮他的原理说得特别的清晰公募量化大概多少年的历史了做一个定义啊比如说量化我们选股票这样的基本
基本上也就是从 20 年前吧因为像光大宝德信有一个叫量化核心的公募基金它是中国第一支量化基金就 2004 年成立的那个时候光宝的这个产品的基金经理都是宝德信那边派过来的算
算是老外了所以那个时候算是中国第一支量化基金那么后来随着一些知名的量化从业人员的回国量化慢慢慢慢发展起来到目前为止的话也就是 20 年其实发展最快的也就是过去的 10 年从估值期或有过后量化的发展速度会加快大概这样的能不能帮大家简单划分一下阶段
我们可以从它的量化投资方法我觉得可能更好一点初期的量化投资比如说在 10 年前 15 年前还是一种基本面投资为主对一些基本面的维度金打分得分越高的股票作为一个组合我就去购买还
还是一种比较朴素的数量化投资后来的话可能就会比较系统化系统化就体现在我会研发一些所谓的 Alpha 因子这 Alpha 因子的数量就会越来越多同时我跟很多的基准比如说 300 500 都是各种各样的基准之间做一个匹配甚至是一对一的匹配这样的话我就是每一个基准什么 300 500 我都会匹配很多的 Alpha 因子每个 Alpha 因子匹配过后都可以看作为一个
300 500 的增强的模型而这一下的话就会有很多的模型储备这个时候呢就靠一套编程的方法帮着整个一个过程每天自动化的去运行去跟踪去计算这个时候呢可能就是系统化投资的一个阶段现在的话呢最近的几年
可能五年左右的时间像一些算法交易像机器学习的模型的应用就会更多起来了从联合投资方法这个角度来看的话可以分为这三个阶段听起来是越来越高大上或者说越来越复杂但这个超额是越来越好挖了还是越来越
超额坦率地说最近几年超额下降了还是比较明显的因为 15 年 16 年是股灾和熔断那个时候去量化私募就开始崛起了量化私募的话它的限制相对来说少一点它可以用到很多的高频数据
交易系统它也不需要用公募常用的 OSR 它有一个比较快的高效的交易系统所以那个时候的话市场的参与者相对来说也比较的少同时像高频数据 level 2 数据也就是从 15 年代开始交易所开始提供有的所以那个时候的话拭目就开始崛起基本上到 21 年这是我大致的一个自己的一个感受嗯
应该是量化的一个高峰你看他们的不管是管理规模还是业绩基本上在 2021 年的时候都是一个高峰最近这几年的话呢整个超收益整体来看我个人感觉是下了一个台阶但是呢像 500 300 这样的矿泥指针的超额还是比较明显的
你刚才频繁地提到了因子能不能用最通俗一种的比方给大家克服一下因子到底为何物因子就是一个投资逻辑但是你可能需要用历史数据做一个检验举个例子比如说大家常说低估值的股票往往会具有超额收益如果你有这个理念的话那么你每个月都可以在月初的时候帮全市场的
股票的假设以 PB 为代表这个估值因子计算一遍每个月月初计算所有的股票的 PB 因子跟这些所有的股票的 T 加 10 比如说 T 加 10 时刻的股票的涨跌幅你做一个相关性的检验如果相关性检验的话你可以每天都这样做做出来这个相关性的这个值画一个累加图
如果这个累加图持续向上说明 PB 这个因子值和股票未来的收益之间持续的一个正相关有这个结论过后的话你就去购买这个 PB 的股票就可以了对吧 TDP 的股票做一个整体是可以带来超额收益的
这是一个想法需要数据验证往往这种单因子 PB 因子效果并不可能理想所以你可能要跟其他因子做混合做组合同时呢也要在更加严格的环境下做回溯比如说你把它控在护身 300 这个成分股范围之内显然教授它有规律性有正相关性的这个难度就会增加不少
如果经过这种检验过后这个因子都有持续的这种正相关或者是负相关这种规律这就是一个好的α因子我们的工作其实就在寻找这些所谓的α因子不管是单因子还是做组合比如说我们一般看市场可能会有一个监控面板
听起来感觉好像一个一个因子好像就是一个信号器一样告诉你它是否现在有效或者什么时候失效了通常量化不是这样做的我们量化的话就是帮一个复杂的事情简单化就是我们描述一个基准比如说这个基准可能是 A500 指数也可能是胡仁 300 指数我们就要寻找哪些因素会引起这个指数的波动比如说这个指数的行业分布市值大小
等等之类的那么我们就要在这个成分股里边构建一个新的组合比如说 A500 有 500 只股票成分股有 500 只我们需要在 500 只里边寻找一个新的组合这个组合能在行业市值这些方面跟我对标的这个指数的成分股保持一致
这是我的第一步那第二步的话呢如果说我抽取了一个组合在这方面跟我对标的指数一样的话呢这两个指数两个组合就像双胞胎一样同涨同跌因为它在很多的风险方面都一样嘛那我收益怎么来呢我收益就靠我α因子举个例子假设我们说刚才的估值因子就是一个估值越低收益可能越好就是一个α因子
那么我就需要我抽取的这个组合的估值比我对标的这个 A500 的成本股估值要低因为我知道估值越低越有收益嘛最终就有一套数学上的优化算法这个算法的最大化就都α因子得分同时帮一些行业市值这样的作用的约束条件
来生成我的组合这种组合体现的特征就是我的α因子跟我对标的指数拉开差距同时在一些行业市值风格上面保持一致这就是我们的最基本的方法论所以我们不太看比如说哪个α因子这时候有效或无效或者个股会怎么样市场风格会怎么样我们只要保证我们在研发过程中我们寻找的α因子
或者是混合的阿发因子作为一个整体持续有效就可以了当然一个阿发因子它很容易出现回撤在某个阶段这个时候你就要看你的阿发因子的回撤有没有超过历史最大回撤如果超过历史最大回撤的话你可能这个因子就会比较有严峻的挑战如果在历史的最大回撤范围之内那么它仍然可以去使用这有一套方法论和管理流程来规范的
那是不是一个α因子失效这个事本身它也是有巨大价值的说明市场状态变化了或者说你们某些地方就出问题了
通常我们希望我们找的这个α因子它是持续有效的但这是有一个度什么叫持续有效所以我们在找α因子的时候我们会做一个流程就什么样的因子我们会层层的入库一般来说像固质这样的因子我们会定期跟踪定期做刚才讲的那些检验但我们检验的指标会非常多我们都会编程自动化完成定期检验过后的话形成一份报告这个报告也是自动完成的
好的因子比如说它的 IC 标准在定范围之内我们可能会逐日地跟踪就每天就会计算那个因子值每天都会计算相关的检验指标如果我们跟踪下来我们都有周报每天的一个评估指标如果也比较好那么我就会对这个因子拿出来做单因子的增强模型
单因子增强模型都会比较耗我们的时间和资源但是我们觉得也是值得的单因子的模型我们也会每天跟踪它算出的增强模型的业绩那么这就有一套流程对因子的一个评价因子就会有等级好的因子我就会拿来做模型这模型的话我就会做因子混合我尽量的在基本面因子高频因子和积极学习类因子里面做一个搭配那么我混合出来的因子它的稳定性应该更好
相关度也跟其他因子更低像这样的因子我们才做实盘所以你看很多家的因子挖掘都非常多上千个甚至更多的所以我们最终上实盘的因子它就是通过严谨的数据的检验的基本上一个因子在过去的我们一般做过去十年的维度它的跟未来收益之间的相关度就是比较持续的稳定我们才会去用它经过这套流程来管控因子不会有一个比如说你遇到一个估值因子或盈利因子单一的看
它跟未来受益之间的相关度是很差的甚至一段时间就相反的这也是我后面想追问的一个问题尤其在古代养成了一个审美肯定是偏好低估值的或者有一定安全边际的那这个事它和未来的超额或者跟未来的阿尔法的相关性高吗或者在某一个时间尺度内它的相关性高吗不高呀
所以我们量化就是要做因子混合尽量的用更多的数据大家老是强调基本面要有逻辑其实我个人感觉现在基本面因子的挖掘的我们花的时间很少了因为基本上那些基本面因子我们都已经在很多年前都已经过滤过一遍了因为我们会用量化的方法编程效率很高的我们现在更多的在寻找一些高频的量价就珠币成交珠币委托做出来量价因子和机器学习类的因子
这些因子特别是机器学习类的因子它也许没有四个黑箱但它的实际效果就是不错我们然后呢花很多时间和精力做因子的混合这个是我们追求的最终我们看的是结果就是这个模型的业绩对公母来讲你的
你的交易不能高频但不意味着你不可以用高频因子对吗这个是怎么理解高频就是说高频因子它是这样的比如说我们看行情你比如看万德或童话顺你看到五档行情买一买买三买四买五这种数据都是 level 1 的数据或者是三秒钟一笔的快照数据合成的算是已经很高了对三秒钟一笔的数据但是
但是实际上我们用的数据频率更高我们是 level 2 的数据就是主笔成交主笔委托数据这个都是可以购买得到的数据这种数据它频率是最密切的但是我们会做降频我们会帮它处理成这种分钟数据分钟数据就可以生成是日频的数据比如说我们用记忆学习的方法
我们预测的那个目标值也是未来一段时间的股票涨跌幅我因子是为给模型的可能是分钟级的数据或者是 30 分钟的数据我不用继续学习模型比如说我这普通的高频量价我就会帮那个数据降频足比的降成分钟的分钟的降成日度的然后再去做它也是个日频因子这里面大家会问最终也是日频的对吧那有什么价值跟皮拉日频那完全不一样的
那我这个就可能是半小时的量价比如说有个因子挺有意思的量跌价说股票可能会反转作为一个组合那我这个量和价我就不是这个股票当天的成交量和成交价我就是我抽取出来的大单的就是我通过逐笔成交作为委托去发现哪些单笔的成交量比较高我认为它是个大单
大单的背后的信息含量更高这个股票当天的量和价都是由这些大单组成的量和价那个信息含量是完全不一样的明白所以最终也是一个日平的因子但是我这个日平因子的信息含量和它的内含跟普通的两家因子是完全不一样的所以我们会通过这种方法来把这种高频因子给它纳进去
股民肯定不具备以上的能力嘛那如果我还是想说我低估那我把时间拉得足够长能等待这个低估的回归或者有效益性吗
其实可以啊低估值的风格其实是比较好的但是这个低估值的风格到底怎么定义比如说你是用 PB 还是用 PE 那 PE 的 E 你是用过去的盈利还是用未来的一致预期的盈利这个都是有讲究的我觉得更重要的是这种音质这种风格的选择它是一个组合的概念
这个一定要跟大家讲清楚它并不是说这个 A 股票比 B 股票的估值低那么 A 股票就比 B 股票要好它是说作为一个组合如果你帮整个市场 5000 只股票你分成 5 组或者 10 组 PB 低的那一组长期看会比 PB 高的那一组要好这个是大概率的一个规律这也是一个长期和整体组合的概念它的
它在个股上面其实是不太实用的因为个股的它的这个风格特征各种各样的属性是很复杂的但是作为一个组合就可以对冲最终这个 PB 的特征就可能会带来显著的收益的变化所以这一点要强调的所以我们量化并不研究个股我们量化研究都是组合明白你们因子库体量大概怎样因
因子库的数量现在我们的因子库的定期跟踪的大概是超过 1000 个每天跟踪的大概是有超过 500 个其实我并不觉得这个因子的数量是最关键的因子的质量以及因子怎么是帮一个差因子变为好因子的流程是很关键的像这些学习类的遗传规划它很快很快一天能发掘上千个因子都可以的但它的因子的质量不高通不过我们刚才讲的各种各样检验或者是说它的相关度跟其他因子
非常高这种我们都不会入库的都不会入库的我们也讲究因子的逻辑以及因子的实际的效率只有好的因子我们才会去比较细的做跟踪因为它会占用我们很大的计算资源我觉得因子的质量更重要那你们策略储备呢我们现在每天跟踪的因子是有 500 多个我们对标的基准比如说各类指数大概有 30 多个比如说像我们常见的中正 500
呼声 300,A500,1000,2000,创业版,科创版,红利这些指数我们都是有 30 多个包括我们自己建的因子库,股票库那么我们每一个因子和基准我们都会做匹配做相关的增强模型因子之间也会做混合这些都是我们系统自动化完成的一个情况那如果你通过数据的量来看的话那就是以 T 为单位的这个因子值和这个模型的这个数量
目前量化交易占 A 股每天的日成交量的比重大概是多少我没有具体的数据这个到你要看量化交易到底是什么样的量化交易大家老是说的那种高频程序化交易不在我们公募的策略范畴之内我理解的高频程序化交易它是依赖于速度来挣钱的就是说你这个策略
如果速度不够你就不能挣钱了换句话说它是行情触发的买卖信号就是行情来了那一刻的行情会触发买或卖是那一种像我们公募都不行的因为我们公募的交易系统必须过 O32 所谓的 O32 就是一个联合风控系统就是说你要跟其他的产品之间做联合风控这个时候你的交易速度就会下来
这种策略显然都不适合于公募或者说不适合使用恒生欧莎系统的管理人那么我们公募是绕不开欧莎的在这个约束下你们的交易的时间尺度大概在什么频率所以这里边要可以细讲假设我们的比如说买卖的目标组合是当天晚上形成的
假设是这样那么我这些目标组合我需要在第二天成交这个时候我也需要算法交易的比如说我这些单子几百只股票我几百只股票我要成交我需要有一套算法这套算法比如说我需要这些股票在未来的一段时间比如一小时均匀成交我希望我的成交价是未来一小时的平均价这个算法是透明的你就需要帮你的买卖量
按照未来一小时均匀地下去就好了和我刚才讲的靠速度挣钱的高频交易本质上是完全不同的我这种算法交易的目的是什么目的是希望我在未来一段时间均匀成交拿到均价提高我的交易效率降低我的交易成本我的目标组合是头天晚上就生成好的我只是帮他执行掉而前面说的高频交易它是依靠速度行情触发来挣钱的
能让我感受一下所谓的速度的时间尺度吗速度时间尺度的话像前者的高频交易像 T0 策略
它就是在一秒钟都可以成交好一笔的我见过这样的高频 T0 策略这个在公募里面完全就没有见过只有在私募里面才有像我们的公募里面下单这个算法交易那么在某一刻中 300 只股票的报单也是常见的其实也不是量化像有些公司据我所知个股的买卖也需要使用算法的比如这一只股票它的量比较大它也需要刚才讲的这种算法时间加权的算法帮
帮他去消耗掉他的目的就是为了降低这个冲击成本提高交易效率很多人说量化会利用人的行为偏差来获利你能举几个例子让我具体感受一下这种是啊我们量化的话就是靠这些最大化的因子抽取一个组合这个组合抽取过后我们就是完全的买卖对个股不做人为的干扰除了那个个股它有些黑名单或者是一些事件公司层面的要求
除此之外我们不会对个股做干预的所以它就克服了这个情绪的变化那么我为什么去买这个组合那是因为这个组合的历史回撤的过程当中这个模型就是效果比较好历史回溯业绩比较好我就去购买它这个过程当中我是没有情绪的干扰的那么在构建这个模型的时候有可能你在会选择哪些因子或者因子的权重上面你可能会有一定的主动性 X
X 中心只体现在这个地方一旦这个模型成熟了通常我们一个模型都会这样去做比如说用 15 年到 2000 年的数据来确定一组参数然后用 2000 年的数据到 23 年的数据来确定这组参数的稳定性如果在我们的前面的数据和后面的数据时间段里面参数结果都比较一致那么我们用一些石盘
所以一旦这个参数确定过后的话我们就对它的生成的组合不做人为的干扰这就跟情绪上完全不一样你那个确定这种某一个时间段和过去一个时间段的相似性的参数的体量大概是多少一样的呀就是
就是你训练级和你验证级的那个模型参数完全一致的只是数据不一样一个数据使用训练级数据更老一点比如说刚讲的 15 年到 2000 年验证级的数据呢就是 2000 到 23 年它只是数据不一样模型的其他方面一定是完全一样的那我们上实盘也是完全一样的我刚才为什么问这个呢因为我想起来比如说 9 月份的时候大家说比较像 519 行情
现在马上要 12 月份了大家又说现在像 14 年了对古民也会有在脑子里面主观的一厢情愿的去做这种历史相似性的比较我想知道你
作为您一个量化人来说您看到这种观点您的内心的真实想法是怎样的我觉得数学有专攻有些人确实能够到市场上博取相应的收益但是这个不是量化擅长的量化的方法的话是寻找一个大概率的规律在未来能够复现所以它天然需要样本量很高
比如说你看量化模型失效在什么时候往往在市场大涨或大跌这种情况下量化模型会失效为什么呢因为这种情况在历史上虽然的概率不高不高的话模型就学习不到但是我们认为这些东西它是个小概率事件我只要帮未来的行情大多数的行情能够覆盖住事物的模型有效就可以了
所以我觉得有些人擅长某些领域的一个投资但量化模型它有它自己擅长的地方我们各自做好自己的工作就可以了所谓的尾部事件或者尾部风险比如说今年二月份的我特别好奇这种尾部风险它是不是有多种情况呢还是说主要就是以流动性风险为主今年二月份我觉得并不完全是这样今年二月份的量化的回撤主要是风险管控上面的一个问题
可能某些机构它为了追求收益它的持仓的范围涵盖了很多小微股票比如说作为一个中正 500 的指数增强成本股就 500 个如果你把你的持仓严格控制在成本股发卖之内你在 2 月份不会出现
这么大的回撤甚至你还是有超额收益的假设你的持仓平均市值和中能 500 都一样大概 200 多亿平均市值你认为你的市值这个风格就中心了吗但是你的持仓的结构非常偏离比如说你可能持了 1000 多只股票里边有 20% 30%的都是中能 2000 甚至更小的股票
中等 2000 平均值才 40 亿小微股票更小如果你做一个整体你是 200 多亿但你的持仓的结构非常分散当这些小微股票出现踩踏的时候你的模型出现回撤那是什么问题那不是量化方法出现问题那是因为你的风险管控或者是你的产品选择的问题所以你可以对比一下公募这段时间的中等 500 或者是 300 的增强模型还是有超额的那么我觉得更好的一个例子就是 9 月底和 10 月初这波大涨
从 9 月 24 号开始到 10 月 8 号这个时间你会发现基本上量化的指针产品都会出现明显的回撤它即使你在成本股范围之内你也会出现回撤这个更好的解释这种大涨是很少见的当天指数都有可能会涨停那种明智的回撤真的是回撤还是跑输跑输指数我的回撤都是指增强模型的超额收益就是负阿尔巴对就阿尔巴为负我们其实量化就是不太看β只看
只看α所以 2 月份的回撤也是指α回撤 9 月底到 10 月份的回撤也是指超额收益的回撤那么两者回撤概念完全不同 2 月份是一种风险管控的问题 9 月底 10 月初的确确是量化模型的一个短板就在这地方但是我们理解为它是一个很小概率的事件历史上出现这种幅度的上涨或下跌的概率很低所以尾部事件它只是说概率低你没见过但它的表现形式可能是多种多样的
对它的触发的因素是多种多样的比如说像 2014 年的 12 月份的银行股大涨当时的市场上的对通产品的平均回撤有 8 个点只是那个时候大股票很好补回来没有踩踏的行为量化的问题就在于它是追求一个大概率能够成功的规律它需要数据需要案例点的保证积累一些小的事件的发生它就会产生问题
我们说 A 股的牛熊周期在你们看来是不是说就是越骗宏观的事它的数据点其实是越少的所以你们所以我们更需要人来没有所以
所以我们就不折尸我们对行业也不折对这种仓位也不折我们认为折尸在我看来我认为有些人是可以做出的特别是在从持有人的角度你如果判断好这个市场的这个方向你就应该自信合一这个我觉得也是正确的但是刚讲数位有专攻这种折尸对量化来说就是有严峻的问题因为案例点太少比如说你制硬币你制十次都猜对了第十一次你能猜对吗
我看过很多量化折尺模型它们的效果都很好但是问题也很明显大多数都是通过牺牲这个案例点
来提高你的命中率我觉得你的案例点数量少于 30 个这个折射模型都不值得去信赖量化有一个理论的公式就是你的最终的效果等于你的能力乘上你的宽度开个更好宽度你就可以视为股票数量或者你折射的次数折射开个更好过后天然的这个就很差很少股票如果你在 500 1000 里面选开个更好也是很多的所以我们不折射所以我们做指针仓位就是满满的我对行业我都不偏离
这也是我现在想问的你做指针不择时我完全能理解
你做指针的时候连行业都不去做骗率那意味着你只在个股上面去做骗率咯我们以宏利或者是 A500 为例你可以带着例子给大家展开讲一讲好呀比如说你 A500 这个指针那么在产品的运动的初期我可能更严格基本 100%来自于成本股像这种情况下我像 2 月份的内部回车就不会出现了因为我成本股约束很紧嘛对吧然后在行业层面我就是中性我这个中性的话并不是说像大家说的是一模一样的
比如说我们以行业它有一个中性行业分类或者生化行业分类你有一个参照
比如说还有一级行业二级行业是一级行业大概有 30 个它每个行业有个比重我的中心的话就是我的持长的行业的比例和我对标的指数在一个非常窄的范围内在你写程序的时候你不能写等号要求我的组合跟我对标的基准是等于它你的程序就无解的所以它是一个非常窄的范围比如说 0.05 或者是 0.005%这都很小了对吧有个优化空间这个时候在我们的统计意义上就是行业中心的这个
这个时候法律合同并没有规定你要合约行业中心你可以帮你的行业约束每个行业从 0.005%扩大到 1%也是可以的这个时候自然会有些行业超配或低配在上下 1%这个幅度里面
但是这里面有个非常核心的问题这个行业的超配和低配并不是我主观的对这个行业它的未来的涨跌做个判断得出的而是说这个行业的成分股在我最大化这些α因子的得分上这些行业的成分股
就是比其他行业要好这个行业就自然的超配那些成分股的 alpha int 的得分偏低的它自然的在这个阅促空间里面它就低配所以这个是我们量化的一个规律当然我也知道很多的同行他会主观的对一些行业单独建模型但这个就是说大家各自根据自己的相对优势来做就是大家的方法论选择的问题对
像我们就不太对这个行业做主动的或者是单独的建测式模型因此也是一样的我理解大家做指增可能就是两个思路或者是两个思路都要用要不然是中观上做偏离要不然是微观上做偏离
像我们的偏离就像我刚讲的首先你可以列为我们就是行业风格上不做偏离我们会在个股上做偏离个股虽然都是来自于成分股可能中的 A500 有 500 个成分股我可能最终的一个模型有 200 只股票入选了 200 只股票它的权重和它之前在成分股里的权重是不一样的
但是这是靠优化算法的计算得出的优化算法就是最大化这些股票的得分 AlphaIn 的得分自然而然的给出一个权重他不是我主观的人说这个股票要配多少权比那个股票要高就跟解方程一样这个方程自然会给出你一个解满足你的约束条件那在个股上的偏离具体又是怎么落地的呢我知道那个优化算法所以基本上你就不做干预了不做干预啊当然它约束条件在实操过程会很多
我刚才只讲你的目标函数最大化阿法因的得分约束条件有你的行业中心风格中性但还有换手率的约束调仓频率的约束跟踪误差的约束以及对单独股票的一个权重上下轨的一个约束这个就是每一家每个经营经理自己的一些不同的地方了所以在那个片里到底是更集中还是更分散你并不太去干预我不干预我只要看历史回溯当我满足我的产品合同满足我的收益目标特征的情况之下
我就完全的看历史回撤业绩历史回撤业绩好我就认为这个模型在未来能够获取到历史回溯业绩我就帮他用于试盘你刚才说 A50080%是成本股对那剩下的 20%呢像我开始先期的时候我就会基本来自于成本股保持更加的稳定后期的话你就是做一个扩展比如说你扩展到在 A500 的市值周边的比如说到 800%
或者 1000 这个就是你自己的定义这里面其实是蛮有讲究的也涉及到一些核心的东西就是我说的不能料太具体也不一定方法论就很简单就是你要造个股票库这个股票库的股票数量要稍微增强一点但是你的历史业绩不会比你 A500 要差这么一个股票库这个股票库目标就是这个因为股票的数量越多按照刚才讲的那种公式效果就越好但是你造股票库的逻辑又不能太复杂太复杂过后你后面的增强就很差了
当然你造的股票库的业绩也不能比你的原来的股票要差所以造的股票库过后你可以在股票库的范围之内把 20%的仓位放过去就好了那你觉得咱就说比如都是跟中 A500 之争大家的这个 alpha 的差异的胜负手是在那个 80%那儿呢还是在 20%这儿呢它应该也是一个历史数据告诉你的
关键在那α因子上其实我们做α因子检验的时候我们就会很严格就是这个α因子在全市场范围内是怎么样的在 2000 1800 300 500 是怎么样的我们认为一个好的α因子应该在各个范围之内都有规律性其实一个因子在一个全市场范围内很容易有效的但是在 300 500 的范围之内就不是这样的了
在某一个特定市值约束内特别有效的阿尔法如果在其他地方并不有效你并不认为它是个好阿尔法是吗对啊那看我的产品你在全市上有效的因子你在 A500 上不一定有效的所以这种情况之下的话如果我按照这种规则挑选出的阿尔法因子即使我的成分股 20%是来自于成分股之外的那么它仍然是比较不错的这就看你各家每一个人是怎么把控你的因子了我自己看过 300 500
1000 2000 的公募的只增我发现一个特点就是当我把他们业绩曲线全部都放到一块我又发现 300 的超额大家是没有那么夸张的对啊但是市值月下沉到 500 到 1000 到 2000 非常大的 alpha 的区别是这样的按照刚才的理论公式来看的话
正常情况下的话股票数量越多你可能效果会越好这个长期大概率是这种分布的就是广度越大理论上的α空间是越足的因为你的α因子的这个效果会越好你寻找一个大概的规律更加稳定你在一个很窄的范围之内比如说红利你很少听到哪家
实目去做这个红利增强也有但是很少相对中的 500 它特别受某只股票的干扰你这个股票你配不到或者这个股票受它特定时间的影响超额数据就产生不稳定所以你需要股票数量进行对冲的既然这我们继续聊聊红利的增强因为你也有相关的产品对那红利的增强你的思路是什么呢
红利增强其实我们跟 500 增强和它的共用一套体系很多的 iFi 因子也是共用的但是有它的特殊的一个地方比如说我们有一类 iFi 因子在 500 里面就不太会用但是在红利里面我们就非常重视就是对上市公司它未来分红金额能否持续的建模这个是我们觉得很重要的对红利这个资产的一个 iFi 因子
你看美国的那种大的红利 ETF 更多的指数它的编制方法基本上都强调它的这个分红金额要一年比一年高因为它红利资产之所以受欢迎就是因为它是要每年分派股息你不能说今年分配了明年不分配了那你的红利资产的本质属性就降低了但是呢如果在中国市场你强调分红金额连续增长那么它作为一个组合它的股息率就会降低全市场里边你先按股息率排序
选 100 个那么股息率可能就无联集如果你说先强调连续三年分红金额都连续上涨然后再在里边挑选 100 个股息率最高的那你的股息率就要小很多所以这个时候你就需要量化方法来对股息率能够支育增长建模这个就是我们在红利里边比较独特的一个地方因为分红这个事它有可能是分红比例的问题分红意愿的问题这些事都能所以你要建模呀所以你想那些研究公司派的人天天在那儿
琢磨然后看跑调研对啊那你们远程就是通过数据也能不分逼近这个事吗你想想我们有一致预期数据呀他们分析师写的报告里面都会对这个上市公司未来的业绩做一个判断吗你给分析师的一致预期的这个数据的知性度高吗那你要看你的处理方法有很多方法可以处理的比如说一只股票
覆盖度有 10 个分析师覆盖每个分析师都会对这个股票未来的业绩做一个值这个时候我就需要对这些分析师做一个复权这个复权怎么复是非常关键的你怎么该复权有很多的文章已经做过研究了比如说这个分析师他的从业的时间长度团队大小覆盖的股票数量还有他过去预测的准确度你都可以做检验不是说他拿奖了就决定好的逻辑上会影响他盈利预测准确度的这些指标维度做一个统计
自然会得出哪些分析师可以给更高的权重最终通过你的权重再给那些分析师对这三个公式的盈利预测做一个复权
那么你这个业绩的准确度就会相对的提高所以它是有一套标准的方法和逻辑处理的当然也不一定完全准确我们并不强调单个股票的准确度我们是强调一个组合就我做出来这个盈利增速高的组合准确度要比我的成分股高就行了所以量化的本质你一定要盯住我是有个参照的我有个参照我相对上就好做很多我再问一个细节问题大家买红利其实很多时候也是相当看重股息率的分红的对
那对比如红利增强来说我能拿到那个股息吗红利增强能拿到股息啊并且红利增强的话可能会比 ETF 更加的
好一点因为股息有股息税在初天日的那一天你的持有的这个股票市值就会分解为扣掉红利那一部分的市值以及分红的现金并且现金部分还要纳一部分税其实我们是做过研究的很多股票在它初天日之后的股价表现作为一个整体会弱这个时候你不如在初天日之前给它卖出这时候你还不需要
红利税了对吧我们量化方法可能这方面更加的灵活因为你是 ETF 你是指数的你的成分股不变的情况下你是不能轻易的买卖的但我量化的可以做的点事情当然它也是双人件也可能会产生过多的交易费用就看你模型的准确度如何了那是不是比如红利增强它的交易便利会更低一些那显然是这样的因为红利增强的难度其实是比较高的因为它的成分股很少
它对它的很多的交易因子机器学习的因子在红利上面都不太有效所以分红金额可持续增长建模就很关键这一类的因子在 A500 上面用的就比较的少那基本面因子在红利增强这个领域大家还能卷出来什么差异吗就是我刚才讲的那个就很关键因为你对分红金额可持续增长建模分解下来就是
这个上市公司它首先需要盈利增加同时股息支付率就是分红的意愿要稳定那么就分解为两块了对盈利的预测和股息支付率的预测盈利的预测你又可以进一步拆解除了用到这个上市卖方的一致预期数据之外你可能要在这个上市公司所处的行业比如
比如说他资本开支资产负债率他处的阶段做一个分析就是你不断地延伸处于阶段的这些这是人的来定还是数据来定所以你越往基本面分析的话你对数据的数量有一定要求的但是我们不可能用人为来判断你还要基于数据那数据要可得比如说他的资本开支资产负债率这种数据你就可以用上再细往下分的话就可能越来越难
就是在红利增强上你会做行业上的便利吗也是一样的这个是我个人的一个方法论选择问题对或者风格我是偏保守的我需要我的产品有长期持续的超额对我来说更重要那么我就会对这种成分股行业非常看重但是红利这个产品它不是标准的指正它是一个主题产品我的考核范围也有很多红利的主动的产品
那么我在这个行业偏离上就会比像 A500 这样的应该来说有更大的空间合理的对但是像我刚才说的一样我并不擅长对这个行业做那个单独的涨跌的判断从来则是哪怕是我的行业在有超配和低配也是因为我的约束条件从 0.05%放宽到 1%有些行业就超配到 1%或低配到 1%
还是因为它的成分股的α因子的得分高所超配或者是低所低配我不会主动的去选择我站在机敏的立场再问一个指增指增肯定是在 beta 的层面做α对但这是你的工作对对投资者而言比如站在当下这个时点如果我能选出来一个未来表现更好的 beta 其实是事半功倍的
所以我想问 Beta 则是难吗或者说不管它难不难我是一个投资者当我要买一个公募之争那我必然要面临的一个问题就是比如说红利 变货混合 300 500 A500 1000 2000 我总得选吧你有没有什么思路能帮我去做这个决策给我一些思路好呀 也不妨分享一下个人的经验市场上的话比如说这种红利拉长看的收益就比较不错红利资产红利的全收益指数不是价格指数
拉长看它基本上是一种类绝对收益它在 18 年也会跌 10 个点以上但是拉长看它就有类绝对收益属性所以这一类红利资产的本质还是它的低估值高盈利这一类资产的话其实是有长期配置价值的如果你做一个资产的配置在一个利率下行的年代帮你顶着资金配在红利资产上不管是国际还是国内都是一个很好的选择我个人是想理解的
还有一类因为红利资产落到行业层面你会发现它有银行股占比过高大家可能会觉得单个行业的占比过高这个时候还有一类策略叫 PBIOE 策略你就帮全市场的 IOE 大于 15%的股票拿出来再在里边按照股息率高低选择股息率高的一半简单的一个划分你会发现过去几年的业绩也是很不错的为什么 18 年之前和之后就这个红利它这个股息率有如此明显的
台省对啊现在的股息率水平应该处在历史的一个高位对吧虽然最近一年多有点往下但整体来讲还是一个高位是这个是根据上市公司的它的成熟的程度以及这个监管部门对这个分红的强调是有密切关系的你看一下那个分红的上市公司它的种类分红最高的就是银行煤炭煤炭公用事业对吧通信商这些板块四大金刚
对啊这些行当它就是一个也是有央企国企背景的居多同时它确实处在一个比较成熟的一个行业里边随着我们国家这个股市的发展和数量和对这个分红回购的这种重视程度它自然的就会提高我觉得这是一种趋势未来可能会更高其实你如果国际比较我们上市公司的每年的分红的次数数量
行业分布其实都有提升空间其实我们现在这方面还在大步向前的一个阶段你看美国的那个红利 ETF 单只规模都是大几百亿美元的是因为分红确实它每年都有一部分落袋为安整个利率这么低越来越低现在我们的央行的政策帮助房贷利率降低了你到手的那种收益比如说存款的收益可能还跑不赢通胀这个时候你把这个钱做一个配置盘配置啊我不是说你所有的钱一部分的钱你对
你去配什么你去配红利资产红利资产的波动也许短期看略微大一点但拉长看它性价比就很高所以在国际市场上很多人就是帮红利资产当做公知的定投的很好的一个资产每个月我就定投一部分那么它的最终的结果也就不错的所以在这个利率下行的大的背景之下在我们国家上市公司分红的这个质量越来越高的情况之下红利资产的配置价值是比较好的
也许你看到比如说过去一两年特别今年红利资产涨得很多对吧你觉得贵我担心这次你看了一个比较窄的一个比较短的一个市场我们的产品的生命力在更长期我们都是要长期的规模不断地上涨的我们不是说看很短从这个角度来看的话红利资产它就是比较好的一类资产那我继续问因为 18 年那个上台阶导致很多人喜欢通过那个股息率的百分位来判断它就导致你怎么看它都是低估的
因为它股息率比较高在高位你怎么看待这种因为它是有一个特别大的像变异一样就是 18 年之前和之后真的是完全两个阶段比如说我看我这个股息百分倍那我是否还要去看 18 年之前的呢还是这个问题还是在于你做一个简化不能看个股还得看组合这个组合你就标注一些核心的指数比如说中等红利指数中等护港城高股息指数这些指数就是在 A 股或者在港股里边股息率最高的
就是 100 个股票简单看就是这样的那么就是这个市场这个时间段股息率最高的股票历史上它可能股息率整体有个跳跃没有关系但是我就跟股息率低的那个股票进行比较我把我股息率最高的 100 个股票作为我的成分股这个指数过去的表现就是相对比较好大长看也有些时段不好那么就可以了你如果是看单个股票某一个时间段确实是但是你要这样角度看的话就简单点了
比如说神奇公式这个标准你们自己回测过吗回测过啊效果很好对 做得不错的就是很简单的一个标准不错的大家都可以去测
或者说它的风险收益特征是还 OK 的可以 OK 的你可以回去自己做个检验像这一类的话它就是平衡型的估值也低因为最终在 ROE 高里面去找股息率高的股票 ROE 高它这个竞争力就比较强 ROE 高的里面再寻找股息率高的那么估值上面又有相对的优势这个大厂看是不错的还有一个就是宽基宽基的话好处在于它的超额更容易做更好做它超额会高像这几类都是投资者去选择 Beta 的我的一个建议
我觉得我应该淡化就是谁更好的这个想法也不用太别的敏感和介意这所有的一切都是历史数据的一个结果未来会怎么样我们只认为我们过去的检验它没有用到未来数据它在未来就应该能够延续但是所有的好和坏的评价都是基于历史的数据
我发现我聊过的所有的做量化的老师都有这个特点就是特别偏本能的去价值观对啊量化就是一个类工具一个像个机器一样的最终靠你的业绩来说的话它是一个很简单的能够说清楚的一个事情我在落实到选择产品上比如说我这个贝塔我选完了像我刚才说的那个工作
我把所有跟踪 A500 的所有跟踪互认三百的这个指增我都列出来我以普通基民我的信息还有分析能力都非常有限但是呢这个净值是一目了然的然后超额是能看出来的那我能不能仅通过我非常有限的这些能力通过这个方法来判断谁更有投资价值呢
这个其实来说的话你要看你的业绩看有多长这个你如果看得很短的时间内也不一定是最好的一种评判我觉得你还是要看他的公司相关产品的业绩团队从业者的经验以及他管的产品的业绩都还是要综合考量的我也觉得你要观测的业绩的变化及时地做出调整
综合下来看对于宽基指针的话作为一个整体公募超额还是比较明显的
如果你只看两个月显然是不可取的因为我们还是觉得我们的 alpha 因子它是一个长期有效的你不排除这两个月就失效但是跟刚才讲的问题是两个问题一个模型在过去的比如五年里边它是有一个明显的超额的和在过去的五年里边本来是 80 的月份都有超额也许第二者它整体的超额会比第一个要低那我可能也是首选第二个因为它超额更稳定这个道理就是一样
我们做量化我们的阿玛因子我们就是要它持续有效这是我们的要求就是概率对你们是更有诱惑的我还是希望它在未来能够持续在未来能够持续的前提就是说它在历史每个月份的不同的时间段它都能够相对的有效它未来它能够有效你说它忽高忽低这个月没有效另一个月有效了过去五年有效那它未来不是这样的
能不能给大家介绍或者是安利几个判断一个公募执政产品还能用的评判指标比如说刚才你就提到了阅读超额胜率这个指标但好像一般的软件也没有提供这个数据统计可能还得大家自己去算这个比较容易算因为公募基因的进制每天都是公告的你就拉出来看就很好还有什么类似的指标除了像我刚才说的我拉走式看一眼这之外呢
就像我刚才讲的这个公司和经理团队的一些情况我觉得这些都蛮重要的那我们来聊聊你和你的团队呗可以啊 没问题就给大家介绍一下情况我们团队的话呢
有几个特点还是非常值得讲的第一个特点的话是我们团队的个人的经验还都比较丰富因为量化的话是需要积累的对吧你的量化因子你别看你人很多如果你都是新人你没有量化因子的累积的你可能每年都会挖很多的因子那你挖了十年那你因子的数量就不一样我觉得应该是人数乘以你的时长
最终还是量化为你因子的数量和质量这是一个很重要的地方另外一个地方我觉得你这个团队的配合度非常关键你别看有些团队人很多但还是各自为战就是说正常情况下一个公司都有一个公共的因子库对吧我们说因子非常重要公共的因子库每个基金经理有自己的一个因子库
自然而然的每个人不太愿意帮自己的因子贡献出来都想从公共因子库里面获取而不愿意帮自己的因子交出去这很自然而然的一个现象他觉得这个因子是核心竞争力那我能通过奖励机制把这个事儿
白白吗你如果讲了一句我们有种方法我觉得可能更好一点也是过去跟很多师母接触不断地带团队总结出来的就是我们要求就有一个音质库大家不能有自己的或者你的音质必须来自于公共音质库里这个音质库我们要充分共享
我的共享是充分共享就是说你的音质值音质的检验音质的代码音质的说明文档我都是要放在公共的服务器里面大家都能看到不会对某个人遮遮掩掩的在什么地方下不共享呢就是你用哪些音质音质怎么复杂
付权这个代码部分你是可以封装的每个精英精灵你不需要跟其他人共享就跟大家共用一套厨房的设备一样和食材一样但是你最终炒菜的着料和用哪些食材
你是自己的因为最终产品是基金经理负责制对吧如果你的业绩越好你自己越好所以公共银纸库的质量越高你的产品业绩不会差的所以它既有一种合作性又有一种基金的保护在我们的团队里边我们帮得到规则充分地讨论大家都认可给它制定下来过我们就严格地执行这就是我们团队的一个特征就是它形成真正的团队性规模大概多少的人数
符合这个特征的人有四位同事四位同事有三位从业时间都非常长基本上都是十年我像我自己十四年另外一个也是十多年还有一个是八九年的就一个比较年轻另外就是你的交易系统数据服务器这一块有个很重要的一个维度我觉得大家可能是接触不到我们这个量化它需要一串代码和系统平台这个每天都会自动运维因子的计算模型的计算一级跟踪都是代码自动完成的
那么这个系统的它的稳定性或者是出错率就非常重要基本上在我第二家公司的时候我们的系统就不太会出错这个就是你的整个一个策略平台的架构问题所以你看我们的数据库里面有很多的中间表很多代码偶合性很松某个地方出错过后剩下的地方还能够容错
比如说啪有一个新的股票进来了那么它是不能够自动的识别和甄别这个都需要你的数据库编程的时候有个很好的很好的架构框架的来保证你不太容易出错当你的因子出来很多指数很多产品很多的时候你都会手忙脚乱万一哪天出错了你要去备份你要去回滚你要去检查
你都是有很大的麻烦的所以你这个模型架构不容易出错这个是考验一个团队水平的一个非常重要的因素这个因素的话外界很难观察到只有自己才知道可以聊聊数据你可以补充一些你想分享的大家老是觉得通过基本面来找一些东西
要有逻辑性当然是非常重要的了但现在我们的很多的 level 2 数据像租币成交租币委托数据它含有的信息含量是很高的比如说用可能挖掘比如说机构单大资金的成交的量和价和你全天量和价的信息含量是不一样的特定时段的量价又不一样比如说收盘前半小时的这个信息和你全天信息又是不一样的
这些都要通过高频数据来获取我想问一下你这个挖是现在研究员挖和比如说算法来挖 AI 来挖它占比是多少或者分布是多少我们因此数量上面也差不多但是我们时间分配上机器学习模型的
花了我们大量的时间包括高频数据的处理上其实它跟机器挖和人工挖我觉得并没有特别本质的区别因为那些模型也是你做的也是你设置的比如说我们说机器学习模型我们有个机器学习模型的框架网上很多开源的框架代码都是有线程的但是过去我带团队
发现每个人编的积极学习的模型的代码我都要做审核不一样看起来就会很吃力不保证它的代码哪个地方就会出现错误所以你需要一套框架这个框架你像积极学习本质原理比如高开低收这些数据输到模型当中去寻找它跟未来股票涨跌比如说未来股票 10 天的涨跌幅之间的关系寻找出一个规律出来通过训练级验证级得到一个规律定下来过后
本质上就是个非线性的组合你会帮高开低收做一些公式的计算生成很多特征比如 300 个特征这个叫做特征工程帮这些特征彼此进行非线性的组合来预测出股票的未来时间的一个涨跌幅预测的涨跌幅在你训练数据集里边跟你真实的涨跌幅做一个比较它可能会有差异的
然后你会调整各个参数使得差异越来越小最终确定一组参数这组参数确定过后在验证集数据集里边再做一次验证如果有效了就固定下来这倒是万法论但是你会发现
它有几个关键点首先你的原始数据要统一你不能说 A 用了一组 B 用了另外一组你的特征计算怎么进行加点乘除怎么进行合成你需要有个统一的公式不是说你随便自己去写这个因子和那个因子之间做一个正交做一个加点乘除不用你写你很容易出错的比如说你的训练级比如说 15 年到 2000 年它可能会选择 15 年到 2001 年
这些你也不要自己写了你就调用统一的一个标准就好了比如说一种模型你总共生成多少个特征这个特征通过多少轮的传递你需要用到哪些激活函数这些我都需要你在一个配置文件里面给我集中起来你不要东一块西一块这个参数在代码里面另外一个参数在另外一个地方我需要一个统一的配置文件我要看这个配置文件我就一目了然
最终你的模型要存在一个固定的地方能够通过一个通用的指标做展示你不能说你展示的就是
全市场的表现情况它展示的互动 300 的表现情况我无法对比这些都要一套框架帮助你规范管理降低你的出错率以及提高你的工作效率这些都很考验联网团队的虽然本质的模型多数那么些但是这个框架本身其实就很考验你的团队力量这个框架搭建虽然有很多的模块你可以掉但它确实是很好时间和精力的
你看机器学习模型大家用的本质上你有一个博士生或者是一个实习生你都可以做机器学习模型的效果也还可以但是你想提高你想找到你这个因子和其他因子相关度低的模型非常难为什么因为你对机器学习的理论不了解你对数据不了解你只能会调用第三方的包你无法改进离开那些包你就不知道怎么弄了你需要把那些包打开模型的结构你做一些深化
原始数据的处理方式你做一些优化这些你没有经验和理论基础你是做不了的它不像我基本面投资我这个估值 PB 有些现金我可以处理处理商誉我可以处理处理这个逻辑这很难很好但是能想明白技术学习你想不明白的你说我这个数量从 60 变成 100 变成 80 有什么意义吗没有太大的意义你要知道它的后面的这个逻辑
然后能够得到一个精巧的提高你看机器学习模型的一个演进都是一些很精巧的一种思路获得了一个很仗台这次的效果的提升这些你没有理论背景做基础你不是做了很多年的数据的清洗和挖掘你很难做得出来的我觉得这个上面以后会蛮考验也不是说以后大家都用了这种方法论用了数据业绩就会趋于一致或者业绩就会越来越少这方面其实是蛮考验一个团队的
我好奇卖方的进攻团队之与你们是什么关系呢卖方进攻团队现在做得越来越好了呀他们做到很多的报告我们都会拿来去作为我们灵感之一吧我们也会对他的报告的因子做一个附现因为量化的团队他们往往的报告的结论这一块各不一样有些是做严格的指数增强比如行业都是中性都来对成本股有些就不是这样的所以他的结论你很难做一个统一的比较或者说很难一目了然所以这个时候我就会帮他的方法拿过来
跟他来讨论然后我们去复现复现出来过后的这个效果经过我们的检验模块如果比较不错的那么我们可以纳入到我们的体系当中去这个也是蛮有帮助的量化它需要交流和讨论的但对于卖方来说的话讨论就比较的充分但不像同行之间你很难特别的去聊确实也是这样的因为那些做了比较经验的我可以从里面的一些信息可能都会很有启发这个基本的方法论我觉得是需要普及和科普的
但对于卖方进攻团队来说的话我们可以聊得更深我们路演的时候像我一般都会邀请他的报告好我都会邀请他们过来路演路演的时候我也非常重视他们我在之前会对报告都会看之后的话我一般会浮现提出自己的一些思考和要求跟他们一起进步我觉得我们要讲的那种习惯互相的彼此成就不能把他们当做很孤立地去看待他们的问题我觉得对我们来说卖方确实也有一定的帮助
叔叔你典型的一天一个交易日里的一天基本上我的一天就早上起来开晨会我虽然做量化但是对因为咱们公司主动管理做的还要特色晨会我肯定会听的晨会过后的话就看看产品我每天晚上会复盘但是第二天的话我们会有系统帮所有的模型
它的这个业绩都会做一个展示我都会看一下包括 A500 的模型我也触摸了十几个甚至更多这些模型的表现是什么样的我都会看一下它就会有数据自动的就过来了如果等下要做交易你就肯定要处理的交易了你的目标组合和你的职场之间要做匹配这个我们也是有系统帮助我们抱歉我想打断一下就是你刚才说 A500 的模型你有十几个对啊
但落实到 18 你是会传一个付权呢还是说就是选一个呢它是这样的它是根据你的产品规模大小基本上我们单个模型的持股数量在 200 个左右如果你是 10 个亿以内的产品上一个模型就我个人感觉就可以了
如果你的产品规模更大你可能就需要更多的模型还有一个就是你需要对你的模型做一个业绩跟踪就是说你一个模型配好过后像我们一个模型到达我们生产环境当中去做样本外的跟踪我们即使帮它扣费各种都算过后加入了滑点你这个产品的模型的样本外跟踪业绩和你实盘的业绩还是有偏差的这个时候我们可能就会帮我好的模型上到我实盘当中去
看看试盘的交易的冲击成本对我模型的影响到底有多少那我就会选择主模型和卫星模型这个其实便于我以后帮那个资金仓位配得更高的时候它更加稳定这也是我的选择所以我一定会储备很多模型的那一个模型内部应该是多因子策略的吧
每个模型都多因子都要符合例子回溯啊文件性各种检验你才能上我们有一个严格的制度什么样的模型能够上到生产环境里面去要么外跟踪它是有一套审批流程的基本上看所有的量化采访啊基本上都是我们是多因子策略就是你不太能看到第二个答案但你能不能给我介绍一下这个名词背后多展开一些可以啊这个是这样理解的
所谓因子就是比如刚才讲的估值盈利都算是一个因子但是我们就称为单因子主要的问题是单因子它不稳定 PB 算是一个单因子
就不能再分解下去了但它不太稳定所以你就要进行因子合成一个多因子最终你合成的这个因子也需要通过历史的检验但是这里面有个地方就在于我们有一类因子就叫混合因子这个因子就是由其他因子混合的如果混合的因子你怎么看对它来说也是一个因子大类也是一个单因子但这个因子是由其他因子构成的这就是因子混合的概念比如说我举个例子你在
你在你目标函数中你有 10 个因子 10 个因子负一个权重最大化这个 10 个因子加权后的一个值这是一种做法
你也可以帮那个十个因子先给它复好权重放到你的因子库里边这个因子就当到单因子进行检验那这个时候你目标函数就最大化这个复合因子的得分两个本质上是没有差异的它这个多因子的背后想表述的意思就是说单因子不稳定我希望我的超额收益更加稳定所以我努力地去寻找不同的收益来源使它干扰的地方能够相互对冲帮它收益的地方给它体现出来矜持爱意我觉得嗯
对那我们回到您点心的一天点心的一天就是如果有调仓那么我就去交易这个也有系统帮助我们其实我们现在的系统在我们信息技术部和分控同事的帮助之下还是比较不错的不会占用我过多时间然后呢我们交易是一种算法交易整个成交的过程也是有系统帮助我们跟踪的我们有中央交易室专门有执行交易的同事那么我跟他的时间就去研发我的策略
新的因子新的模型有少数时间可能跟客户进行交流我基本上大多的时间还是在策略员发射比如说你们做指针肯定是奔着超额去的对有没有思路比如说我能不能把波动也能控住
因为是这样比如说护身 300 它的下浮率是足够低的它前期都可能说能不能我长期拿到一个更好的收益但实际拿上才发现你真正承受不起的那个是波动之中我似乎没有看到过指针说我就笨着
让你能长期逼近互联赛买的那个 KEGGER 但是我通过我这个所谓另一种思路的指数尽量帮你降低这个持有过程当中的波动让你持有的更幸福一点好像没有看到过这种思路的产品这个就是波动我们应该定义为是超收益的波动不是 Beta 加 Alpha 的波动因为 Beta 的波动确实很难以把控但是 Alpha 的波动的话其实有各种各样方法的比如说成分股的约束
行业的约束市值的约束以及我的多因子权重的一个配比都是来保证我的超收益的稳定性但是如果你α为正但最后α加β的年度收益为负其实作为一个普通基民它还是会因为α的稳定性可能作为一个普通基民它未必能
深刻地感知到我能感知到你这个问题的一个重要性是因为如果大家能在这种层面都对齐的话我相信很多基金销售问题也就迎刃而解了事实上大家我跟你讲个例子我也蛮有观念的改变的你要要求比如说看未来一个月有可能会出现北的和阿法双亏的现象
那都是种很差对吧但是这还是比较短但是我以前我在去支管之前在我脑海当中我也觉得量化私募它应该做绝对收益都应该是对冲产品不管市场涨跌都能挣钱那就是我们的目标我在公务里面团队里面也有做量化对冲后来我接触了很多的私募特别在我去支管过后我们因为我们有 Folf 我们投了不少家的私募发现私募管理产品的大头
都是指数增强指数增强不像刚才我们理解的高 Beta 高方向高收益但是为什么大头都指针呢那是因为它的超额收益比较好像在 21 年之前你说这个 Beta 当年跌 20 个点以上的概率其实是不高的但是那个时候超额都有 20 个点很多所以这个时候你的 Beta 加 Ava 就是正收益事实上大家不要被这个指数所误导像我们讲富人 300 或者是
或者老是 3000 点保一战等等之类的对吧这里面有个很大的误导就是我们看的价格指数不是全收益指数你帮互生 300 的全收益指数拿出来它的平均的年涨幅跟我们的 GDP 差不多的但你有没有想过你的业绩波动会直接缩短它的持股或者持机的时间那这个时间一缩短谈全收益指数它
它只是一个理论上很美好的所以这个就是问题的关键客户或机密的持有人不好这并不是说这个市场表现一直很差而是在于仓位的高低市场产品波动的过大使你错过那些机会往往机密都是在市场涨的时候仓位很低越涨仓位越高当仓位很高的时候怕是市场不好一下子就不行了
所以这个时候你需要怎么去克服为什么我们 ETF 规模很大规模为什么很大因为老百姓觉得他自己具有折射能力这个产品的属性看得很清楚其实指针也是一样的 Beta 加 AlphaAlpha 是我们的能力 Beta 交给持有人他们来进行折射所以这种产品的规模
应该来说是相对来说能够做出来的因为它相对简单你看很多年份我管的产品比他低的时候客户也能够理解跟他说得很清楚白塔是市场造成的你可以自己去生熟来折这个白塔
Alpha 是我的能力只要我有超额他往往能够理解和接受这个东西还要强调一点跟我们团队是一样的你觉得很多管理人的团队他做失败了是因为他业绩不好吗不是这样的他业绩好的时候管理规模很小业绩越好管理规模越大规模很大的时候或者一下子有很多申购的时候一下子模型失效了收益很差
花书回它就再也没有机会翻身了我们的这个经历和持有人是一样的我们做了这个执政就是帮那个产品简单化就是 Beta 和 AlphaAlpha 是交给我们 Beta 交给持有人这样的话它才能够拿得住如果我们有长期稳定的这个 Alpha 我们帮我们的约束条件都说得很清楚
他就更加相信我们能够这样那么他就跟着我们长期的持有在一块最终的效果是不错的这也是从一定程度避开了他的自己的一个判断局长杀跌这是他收益的一种损害因为你说了现在是用一个策略你怎么看某一个策略它的规模舒适区这个事是能预测到还是说通过超额的空间超额的胜率
他是告诉你的那还是怎么样这个是一个大致的一个基准就是你的对标的指数的成分股它自己的数量和它的市值像 A500 这样的指数 500 个成分股平均的市值 1100 亿你选的股票如果
都是来自于成分股都是这些大宗股票这种大宗股票你说你持有这些股票的这个市值 0.01%0.1%这是完全可以的所以它的规模的容量就自然很大如果你是对标的比如说像中东 2000 这样的股票也许股票数量是比较多但是它单个的市值比较小那规模也就是
比较小凡是种宽积指针的规模其实来说的话在百亿左右其实都是可以的有些单化实木单个产品规模可能没有这么大但是做一个整体它是有这么多的它的这个超额损失下降的幅度就会稍微小一点也会因为最好的因子好的股票就那么多嘛但是它的既要有超额的情况之下它的规模还是不错的对于宽积指数来说的嗯
因为 A500 应该是上规模上的最猛的一个指数了对比如说现在已经过千亿的规模我单指 ETF 对两千亿了都那这个东西跟比如说你们做指增的这个 Alpha 之间有什么关系吗
还是没啥关系 A500 这个指数确实在编制方法上它就是比较好它有 ESG 排除法互通互联又是行业比较均匀具有代表性所以大家都真的想着布局它觉得这个产品的规模能够长大就是因为它编制方法好所以大家都是规模也会迅速提高这个对于我们来说我们的超额相对来说也比较容易做你看现在市场上的主要的公布指针就是互动 300 指针和中动 500 指针还有中动 1000 也有一些是吧
未来 A500 指针一定是一个非常重要的指针为什么呢它的成本股数量多又是大宗股票行业个股又比较均匀
它天然的就比较适合做指针你看成分狗如果在 100 个的时候指针就比较难做混 300 其实都挺难做的但中等 500 相对好做做一个整体那么 A500 更是这样整体而言的话 A500 它是一个非常重要的指数另外一个它确实对量化的超相对来说稍微好做一点红利增强你
你的规模呢你怎么看待这个事红利增强其实也是大股票居多但有一部分股票的市值比较小的也有红利增强的话呢它的成本股数量比较少它的规模可能就会比 A500 从数字来看规模应该更少一点如果你真觉得土
突破到你的舒适区了我单只规模你会限额吗我们不会为了追求规模来牺牲业绩的我们是想要规模但是规模是靠业绩来支撑的就像我刚才讲的是因为规模上去过后业绩不好客户受到损害一旦出现这种情况它的杀伤力是非常强的我们也不追求过高的超额过高的超额就会伴随着过高的风险我们只要能够有一个持续的稳定的超额我们就可能把我们的规模不断地做起来了这是我们的生存之道
我站在基金的角度我再问一个问题就比如说我想买一个指数的直增产品列了之后超额一看人之常情我肯定是说那就买超额最好的那个你怎么看待这个行为就这个超额越好看它的分控约束管理能力以各种情况我觉得还是要综合来看这个公司它的文化强调什么这个一点都不虚的因为这个公司的传承
和公司的文化建设它是个日积月累的过程最终就会显现在你产品业绩的稳定性上其实这是很重要的但它是无形的它是无形的这种口碑传递就像你刚才讲的呀基民他的吃亏的地方在什么地方并不是他选不对产品而是产品的波动太高了他正好错过了那个车上被甩下来了
是那样他的产品收益太受损的他如果寻找到一个比较优质的管理人哪怕短期的业绩不是这么明显但他只要对他长期业绩的稳定性保有信心他就可以长期持有一旦他做有长期持有的理念的话呢
它的收益就是比较好的沪森 300 的全收益指数拉长看就是跟经济的增速是想匹配的或者说如果我能持有个三到五年我就不用去看价格指数而是应该去看以全收益指数作为我的预期收益率的锚是吗其实就是应该看全收益指数不管看长看短因为价格指数本来就是失增的指数因为它分红给你的现金部分是不算进去的那显然是不对的就量化基金经理的基金报告
是不是没什么可能比较因为它跟主动行的不太一样也不尽然我也会经常复盘看同行的一些有些他会写到比如说我用哪些因子的未来表现情况这种还是很有价值的其实他对市场的判断我觉得也有一定的参考性的
只要这个报告是他用心写的就可以了你打算怎么写呢我可能对我的每一份报告我都是蛮用心的去写呀对市场的判断对因子的判断对模型未来的操作的大的框架那你觉得看量化基因经理基因报告有什么特别要注意的地方吗
或者哪一些字眼你看到了你得留意一下或者哪些章节要重点看对量化基金的话我还是比较喜欢看他对他的因子的观点他所用他的因子不管是基本面因子和量量因子他会整体说这批因子在过去有效和无效这个东西对我来说也是蛮有启发性的我也会看的执行度高吗给这些东西不用执行度因为我们做的东西太多了就像你说的一样他要说一些东西我都可以很敏锐地捕捉到一些信息的我也通常对这批因子做相关的研究啊
我也会去参考但是我们有自己的一套方法论不会轻易地改变谈话再说对这种研究报告看的时间相对来说是偏少的我们还是专注于自己的策略研发上面去你能不能给大家一些比如说对 500 啊红利的这个预期啊像我们公司它不是轻易地发一个产品的也是有深远的考量
像那个红利资产我们就观察过不管在国际国内红利资产在利率下行的时代它具有长期的生命力这是一个很重要的一个观点这个在多国别是验证过的是吗验证过的特别是美国为例它的红利资产的规模逐年提高的最近几年也是一年比一年高的按理说它的股票市场的时间是比较长的
但它的这个规模也是逐年提高的就是因为它的红利资产能够跟老百姓的定投的这种文化相匹配能够获取拉长看类绝对收益的属性红利资产的场地生命力在中国会越来越高另外一个我们也观察到现在我们的红利指数的编制方法一些问题过于近代历史像我刚才讲的我们非常强调
分红金额的可持续增长我们觉得我们这个方法这个思想能够落实下来过后能够带来一定的相对更好的一个收益所以我们就是帮这个产品就发行出来了像 A500 一样 A500 它这个指数本来就具有很大的整个市场代表性我们认为这个指数也比较适合做增强
所以我们就发相应的产品其实我们有很多选择像刚才我们讲的我们的系统里面更多 30 多个基准那么我们在 30 个基准里面去观察哪些 Beta 是市场未来相对来说比较好的哪些 Alpha 是我们能够做得更优秀的那么我们选择承受一个发一个承受一个发一个我们也不限于目前两只产品未来可能还会有系列产品因为我们做量化的时候类工具这批 Alpha 因子系统策略
交易都可以共享的所以我们天然的就是一种类工具属性帮我们的富达的工作简单化所以我们可能会发行一系列的产品但我们也向各位也要说一声我们选择一个产品还是要看稍微长一点就要听过我们刚才聊到这么多本质上还是寻找一个比较值得信赖的资产管理人跟他长期一块成长因为你的持有能够收益往往就是因为中间的一个波动导致的最后再帮大家对量化取取媚或者说合理化一点
这个是大家好像不太懂的人吧既觉得又抽象又高大上然后容易带一些比较高的预期其实我自己内心很排斥量化是个黑箱的我一直想帮量化方法尽量的给它透明化我觉得量化的最大的一个特征就是守纪律
就是我们做一个组合过后呢我们就是负责这个组合不对个股做判断另外量化就是组合的概念我们不会对个股建模型我们是对一个组合对一个特征这是我们强调的 alpha 因子组合的概念第二个的话我觉得量化确实方法上还是比较与时俱进的这个可能一个不恰当的例子像中医和西医
西医的话你觉得他就在实验室里面做实验中医的话其实也是一种实验只是你的各种各样病例的经验累积但是西医呢可能在实验室里面呢很快就把你很多实验重复掉了所以很多的基本情况西医都能解决但是中医里边最核心的那个成分可能西医永远也找不到答案量化也是一样量化我们用我们的编程
方法快速地去找到一个规律但是也可能有些主动的精进力的他自己的独特的部分我们是赶不上的这也像写文章一样以前十几年前二十年前读书的时候都是定性的文章现在的文章里没有实证没有数据没有模型都发表不了我觉得量化也是一种方法论的演进以及算力的进步其实我们量化能够处理的东西也会越来越好它是方法上的一个进步 OK 我没什么问题好呀好呀谢谢