We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 从孵化Deepseek的量化说起:量化是割韭菜吗?顶尖研究员为你揭秘

从孵化Deepseek的量化说起:量化是割韭菜吗?顶尖研究员为你揭秘

2025/3/15
logo of podcast 美好生意

美好生意

AI Deep Dive Transcript
People
C
CK
J
Jessica
专注于卡拉OK设置和技巧的专家
L
Lucas
Topics
CK: 我对量化投资的理解是,它是一种有效的工具,可以捕捉市场的波动,并受到监管部门的关注。 Jessica: 我认为量化投资是将数据和算法相结合,去捕捉金融市场阶段性某个维度上的无效性,并将其推向有效。 Lucas: 量化交易的本质并非收割散户,而是将市场从无效状态推向有效状态。它最初与技术分析相似,但随着大数据时代的到来,它可以处理更多类型的数据,并扩展到更多领域。量化交易的优势包括高频交易、纪律性和风险控制;缺点包括黑天鹅事件、过拟合和市场适应性问题。中国监管部门对量化交易持中性偏正面态度,主要关注市场风险,并对高频交易行为进行限制。个人可以尝试量化交易,但需要具备编程、数据处理和方法论研究能力,且需要较大的资金量才能获得稳定收益。散户可以通过深入研究公司基本面,获得比量化机构更深入的了解,从而获得优势。互联网大数据模型比量化模型更复杂,因为前者对可解释性的要求较低,而后者对风险控制和可解释性的要求更高。美国市场整体有效性高于A股,导致美国量化竞争更激烈,而A股市场量化交易空间更大。大模型可以辅助量化交易,提高效率,但直接用于预测股票涨跌效果不稳定,主要原因是数据量不足和过拟合问题。量化公司开发大模型,是为了提高研究效率和处理非结构化数据的能力,以及探索新的盈利模式。DeepSeek的开发体现了量化公司承担社会责任,并探索新的发展方向的意愿。 CK: 量化投资起源于20世纪中叶,随着计算机技术和数学模型的引入而兴起,并在21世纪进入高频交易时代。美国量化交易规模庞大,交易量占市场很大比例,并受到严格监管。中国量化行业发展迅速,规模不断扩大,但与美国相比仍有较大发展空间。 Jessica: 中国量化行业发展迅速,投资者也呈现出从主观策略向量化策略迁移的趋势。 Lucas: 进入量化行业的门槛越来越高,需要丰富的实习经验或扎实的专业知识。量化行业人才主要来自数学、物理、统计、计算机等理工科专业,也包括金融相关专业。选择量化职业方向是基于个人兴趣和行业特点,例如直接高效的评价模式和快速的反馈机制。量化研究员的工作日常以数据驱动为主,包括分析结果、提出假设、验证假设、部署程序等。量化研究员需要严谨性、创造性和抗挫折能力。过拟合是指模型在训练数据上表现良好,但在新数据上表现不佳。大模型发展对量化行业人才招聘产生影响,顶级量化公司才能与互联网公司在薪酬方面竞争。量化公司将办公室设在清华科技园等科技园区,方便招募人才和进行实习合作。量化从业者的个人投资风格受量化方法论影响,注重风险控制和长期收益。高波动性市场中,部分投资者会因止损而离场,为坚持者提供获利机会。

Deep Dive

Shownotes Transcript

大家好,我是 CK。我是 Jessica。欢迎来到美好生意,与我们一起探索商业之美。准备好了吗?我们出发咯。

2025 新年已始伴随着 DeepSeek 的大火 DS 创始人梁文峰背后的量化基金换方也越来越为人所熟知那在 DeepSeek 出圈的前一年其实量化也因为 A 股的巨大的波动而一度被推上了风口浪尖其实每一次的股灾印象中就量化都会被拿出来祭天所包括在更早一轮就 2016 年那一波杠杆资金崩盘造成的股灾中其实监管部门也出台了对股指期货裸卖空的一些限制政策

那由于古指气货本身对于量化基金来说也是非常重要的交易品种所以说这个政策也对量化行业产生了巨大的影响也不光是量化其实对整个金融市场都产生了非常久远的影响所以量化基金到底是怎么一回事呢是啊量化真的是那个专门捣蛋的快孩子吗那

那我们今天就带着诸多的疑问和好奇打算跟听众们一起好好揭秘一下量化真正的面容那今天光靠我们两个门外汉肯定是不行的就得有真正的专业人士在场所以我们也很荣幸地邀请到了一位好朋友目前在国内的头部量化大厂从事策略开发工作的 Lucas 来为我们答疑解惑欢迎 Lucas 欢迎 Hello 大家好我是 Lucas 目前在从事量化策略研究的相关工作

那在进入正题之前我们觉得还是有必要先跟听众朋友们普及一下量化行业在国内和国外发展的一个情况二十世纪中叶随着计算机技术和数学模型开始引入金融市场

量化交易初步萌芽在 1970 年代呢布莱克舒尔斯模型诞生为金融衍生品交易和风险管理奠定了量化基石 1980 年代投资银行和对冲基金就大量采用计算机模型那量化投资策略也广泛应用 1987 年的黑色星期一之后利用计算机模型来去减少情绪干扰就成为一种趋势了到了 1990 年代互联网和信息技术的发展金融数据一加丰富算法交易占入头角

那么 21 世纪进入了高频交易时代交易时间降至微秒级量化基金运用复杂模型和大数据分析和寻找市场里的机会那在目前的美国股市中呢量化交易所驱动的交易量已经占到整个市场 60%到 75%了所以整个市场中大部分的交易都是由量化产生的

那么头部量化基金的规模非常庞大比如说像桥水是超过了 1500 亿美元 AQR 接近千亿文艺复兴 700 多亿那从监管的情况来看呢美国证监会对量化交易实施了非常严格的监管要求量化交易公司去披露交易策略封控措施等信息并且它会重点监控高频交易等行为那我们再来看一下中国的量化行业啊中国量化

量化行业的元年应该可以追溯到 2010 年股指期货推出之后量化对冲策略有了对冲的工具那么量化行业也因此快速的发展起来了从 2015 年到 2020 年量化的私募规模不断的扩大策略也不断的丰富高频交易等策略逐渐兴起

据中信证券统计 截至 2023 年末中国私募量化的资管总规模约 1.63 万亿元人民币约占国内私募证券基金行业的 29%所以其实从中美两国的量化来对比来看其实中国的量化对比美国同行来说应该还是有很大的一个发展空间因为我们刚才看到在美国的话可能全市场

超过一半以上都是由量化来促成的一个交易那抛开这些数字就是从个人的职业体验来说最近几年的数字的确也是肉眼可见就是量化在中国的资管市场有一个比较快速的发展虽然总量是怎么样的一个变化不好说因为过去几年其实整体的市场环境并不是很好吗

可能整个权益市场可能会有一些萎缩但是不管是从投资人的选择或者是从市场的选择上来看由于量化策略的表现是它的稳定性是要好于传统的一些主观策略的所以投资者也呈现出有主观向量化迁移的特征那么一些传统以主观方式为主的这样的基金尤其是公募基金的话也会体现出 ETF 这种偏量化或者是偏这种被动策略它的占比逐渐产生的这么一个趋势

那我们就跟 Lucas 一起来聊一下我们感兴趣的一些话题好我们先来讲一下量化行业的人才画像什么样的人才能够进入到量化行业呢是不是只有这种高精尖然后类似于黑客对黑客这样的人

首先目前现在这个国内的就业环境来说进入量化行业的门槛确实是越来越高了主要是各家公司像您刚刚提到的这几年其实市场也是竞争越来越激烈并没有那么好做招聘的名额也比较有限

我们拿到的简历往往又非常多所以我们可能也会倾向于用各种方式去过滤一些人才当然并不是说一定要顶尖名校的假如这个人他有比较充足的实习经历证明过他在这上面有能力做研究我们当然也是非常欢迎这样的人才加入的这个的难度会偏大因为他需要可能在大学期间或者是

研究生期间就要有比较明确的这样的职业规划因为要做过一些实习证明他有这样的研究能力目前来说的话一般通过这条路实习这样的路难度会大所以整体来说确实门槛在提高但是我们都是欢迎各种各样的人才加入这样的行业我觉得 Lucas 说的很谦虚但我也 get 到了就是要高金坚名秀对对

我想有个好奇啊就是那如果从专业性的角度来讲就是一些什么样的专业的人是你们这个最主要需要的呢因为比如说它这个量化交易它所需要的技能的角度它是偏金融属性多一些呢它还是偏编程属性多一些首先我们来说的话目前的一个对应的

背景一般是比如说数学物理统计计算机这相关的理工类的专业入行的比较多但是金融相关的行业也不少比如说金融可能更倾向于基本面一些的研究我刚刚前面提到的这些理工类专业更像一些复杂模型的一些研究或者一些量价方面的一些研究目前从背景来说的话

希望他在他目前从事的那个领域有一个比较深入的研究能力那 Lukas 你自己毕业之后为什么会选择量化这个方向呢因为我听你之前说过其实当时你完全没有考虑过互联网大厂的是的就是这个我个人而言是我一个兴趣导向的

在校期间学过相关的课程然后在大学期间研究生期间参加过相关的实习通过一些项目都会发现自己对做金融行业会非常的感兴趣然后包括研究一些算法研究一些因子自己会发现从中是非常有兴趣的就是

量化交易的一些挑战性让我对这个行业很好奇然后呢这个是我非常坚定选择这个行业的一个很重要的原因同时呢你做这行有很明显的成就感和乐趣个人而言一个兴趣导向是非常重要的

还有另外一点就是整个量化行业的一个评价模式自己会比较喜欢因为它相当于比较直接和高效因为交易中我们策略是可以通过历史数据进行回测然后得到一些指标的如果一个策略是能在市场上真正赚钱那它就是有效的如果一个策略你回测的再好是在市场上不赚钱对那它就是没有用的

那这样的一个反馈机制是很直接的且其实是比较快速的一个反馈对我来说我可以很快速的做一些迭代那这样的一个模式我自己是比较喜欢的互联网大厂这一块呢我具体不是特别了解它的一个评价体系但是我会觉得可能会不会存在一些人的因素对就是一些内耗的一些因素然后对我而言的话呢那样的评价模式可能会有一些需要

考虑的东西特别多不像做量化一样可能就是我专心做研究对对对你说到这个我还挺有感触的我想除了有一些评价的这个维度偏主观和个人之外还有一点就是互联网确实是一个

比如说像缩推广这样的领域它确确是一个多目标优化的一个函数就它既要去考虑平台的价值又要考虑优补体验然后再考虑这个这个客户的 ROI 等等所以可能它不像量化那么唯一我不知道这个是不是也是

对应该就是说它没有那么的就量化这个行业它要考虑的因素会少一些就是相当于我也需要策略好然后它可能策略好的同时需要一些其他的指标也好就可以了就你的优化目标是唯一的对就比较清晰一些对然后我自己做迭代呢我也可以自行的就开始迭代起来了然后如果像听起来您刚刚说的那种模式可能它需要迭代的东西目标非常多对是多目标的所以你很多时候需要互相之间有一些 trade off

对其实从这个角度来说我觉得量化它也是多目标的因为它最终其实是收益是一方面然后它的回撤风险控制对我刚刚提到可能对我们来说刚刚那几个因素一考虑进来我们就已经基本上实现了就可能不太需要去考虑比如说

就是他只要能够赚到钱这个策略就是对的但是比如说像互联网的广告领域你光有营收是不够的同时你在有营收的同时你还必须去考虑到你的广告主的 ROI 也要好

要考虑到你的用户体验也要好这些是必须同时达成的目标对我方便问一下 Lucas 你在求学过程中你是学什么专业的吗我学的是统计学所以也是一个偏理工这样的一个背景倒不是纯金融的一个背景是的上学期间接触过一些金融的课程但是更多的当时学的东西和现在应用的金融场景其实并不完全一样所以很多都是在金融相关的知识都是在入行之后

慢慢积累着掌握的那你入行之后比较典型的一天是怎么样的我们还挺好奇的一个量化研究员的一天对包括是不是桌子上要有七八个屏幕二阶大佬对对对这种连续剧里面那种特别炫酷明白首先

屏幕这件事情实时盯盘这个事情它更像一个交易员或者一个操盘手的一个行为因为我们量化模型更多的像是对历史数据进行研究然后我们把策略写好之后每天实盘其实并不需要太多的手段

手动去干涉但是我们有时候也会去盯盘会看一看但是确实不太存在着六七个屏幕实时盯盘这样的一个情况就是并不是一个非常典型的所谓的金融行业的这么一个场景然后我们的一天大概是比如说早上去公司就看一看昨天晚上可能部署的一些

程序跑出来的结果怎么样然后做一些分析迭代然后白天可能会看看研报做一些新的因子或者测一测新的模型这个都是可以的主要是看自己的一个灵感和感觉在哪个方向当然也可以看看盘找找灵感下班之前一般可能就是再跑上数据然后第二天再等着看看结果

如果是涉及到石盘交易或者是一个经经理的身份那可能就需要去盯一下今天市场的盘面是什么样的你的策略石盘的表现到底是好还是坏需不需要做一些迭代

大概的一天的话还是以一个数据驱动这样的模式进行的就是比如说我们分析结果然后提出一个新的假设这个假设可能是看一貌看到的或者自己想到的然后去拿历史数据进行验证然后就把它部署上去跑然后第二天再来看看结果然后我们这里整体的一个工作呢还是需要一个比较严谨的一个

流程对就需要一个严谨性然后还需要一个创造性然后还需要一个其实挺重要的就是抗挫折的能力因为每天你可能有很多假设对其中有 90%95%的可能你验证都没有用那其实是需要一个人热爱这个行业然后编程能力也还可以同时要有能持续做研究的能力因为每次失败之后你要有重头再来对重新再来的热情对

就听上去像是一个做科研的过程对其实挺像是在读博士的像一个感觉就我自己的感觉感受下来其实他没有强制要求你必须什么时间再研究有时候上班时间没有灵感可能你下班回去看到一个人貌看到一个

什么新闻一下就来感觉了这个是其实更像是在做科研或者是读博士的这样一个过程对所以这个行业就是自驱特别重要但是自驱在哪个行业都挺重要的对那你们压力会大吗就是会 996 吗我们目前是不会这样的其实基本上周六周日都是双休这个是基本上有保证的平时加班多吗平时其实

因为金融你知道三点钟就收盘了没有啊三点钟收盘对三点钟就没有下班对三点钟收盘了那后续可能我们再做做研究什么的其实并没有要求你今天我就一定要做出一个什么研究成果来因为如果是从做科研的角度你一天想出一个特别好的成果其实不太现实对所以我们没有强制对一个人加班有要求但是确实

需要可能自己去比如下班时间有时候自己也要去思考对就没有什么强制的一个上班时间那确实跟这个科研其实性价比还挺高就跟做科研的那个节奏感很像是的你不是有那个什么 deadline 今天你一定要完成什么东西但是你可能自己去保持着一个一定的工作强度再去研究它对 是的而且其实他刚才也提到就是像他们因子挖掘的话其实需要很多

有一些创造性的然后有很多这种就是有想象力的所以它其实也是需要就跟我们上期聊保持一些荣誉和空间对吧是是是那你刚才也提到就是说有的时候会从一些言报或者是一些新闻热点事件中获取灵感其实我还蛮好奇的是一些什么样的言报呢是传统金融的这种言报还是一些什么样的言报

这个的话比如说从券商进攻那边他们可能有一些研究结果对但是就是量化领域的一些研究对吧对就是量化领域相关的比如说券商研究所他们有一些研究成果那我们可能会简单的看一下他的一个大概的一个思维然后按照我们的模式进行一些研究和做一些迭代

对一般直接拿来是不太好用的需要自己去结合自己之前的一些认知对它进行一些改造然后就会发现可能就有一些作用

或者是有的时候看一看就上个 B 站这样的一些平台去看一看可能有人分享了一些观点能不能跟自己之前的一些认知相结合其实我觉得投资灵感这样的事情更像是一个认知上的提高就是你从外面吸收到了一些新的知识和你就有的知识相融合那可能就会得到一个升华的结果然后这个结果可能有的时候就是一个灵感然后灵感就能带来一个模型上的迭代

刚才我们聊了一些量化从业者的专业背景人才画像包括一些很典型的 ETA 等等那我觉得我们还是得回过头来跟我们的听众朋友们从源头厘清一些东西就是讲了半天对吧到底什么是量化呢它跟传统的这个金融交易有什么区别或者说它跟这个技术面分析是一回事吗等等这些东西其实也挺好奇的

对所以我们先在这一 part 开始之前我们就是每个人都先说一下吧一句话概括一下量化在心中的印象在我们详细聊之前对看看大家会是一个什么样的印象要不你先说我先说吗我觉得量化在我心中它是一个非常有效的工具去捕捉市场的波动

这是我对量化目前为止的理解因为可能跟我自身行业有关我会倾向于去类比它我觉得量化是一种很典型的大数据技术在金融行业的一种应用我的理解是量化投资是一种把数据和算法相结合去捕捉金融市场

阶段性某个维度上无效性的一种投资方法无效性对就是量化在做的事情是把金融市场某个维度的无效性推向有效的过程那要不我们请 Lucas 展开讲讲啊就是刚才也问到了那个问题那他跟传统的技术面分析是一回事吗对吧有什么异同包括他这种量化交易的主要优势和他的一些缺点是怎么样的

好的就是量化呢最早期的量化可能会倾向于跟技术面分析比较一致就比如说我们去金融市场的什么 MACD 指标 KTX 对类似的指标什么均线双均线指标像这样的模型最早期可能十年前二十年前大家在做量化的时候最开始肯定是去复现这些指标然后去通过复现这些指标得到一个历史回测结果我们来看一下这个东西到底有效无效

对但是随着大数据时代有更多更多复杂的数据的进入那这个模式会有很大的区别比如说量化其实是可以处理更多的比如像本本数据或者是卫星数据我们用卫星拍摄到某家公司它可能人流量或者是一些数据的什么热点图之类的这样的一些数据

这个可能在传统的技术分析它是完全没有办法去做这个分析的对但是量化我们可以捕捉这个数据然后通过这个数据去构建模型

就是其实在后来的时代量化交易会比传统技术分析会再扩展非常多的领域比如说大数据或者是一些舆情数据我们从互联网上获取比如在股巴里面获取大家对这个股票的一些评价然后扒下来这个数据我们去做分析做出模型这个是技术分析肯定是不能实现的一个东西对对对

然后我还经常听到一些就是匪夷所思的一些关联啊比如说就监测那个商场停车场的那个车位的空余情况来去预测这个商场的这个售售额然后还有什么通过看那个那些港口的那些油桶吧

大的那种原油油桶的什么这个倾斜的阴影的面积来估算它的这个储存量等等听起来就特别 FBI 其实这些是一些很有效的数据我理解对就是它肯定是有用的但是它确实能不能获得一个很稳定的回送结果关联性有没有那么强对这个确实不太因为

因为你想您刚提到有些数据我也没有测过我也不敢妄加评价但是确实是我们可以有能力处理这些数据如果它在我们模型中确实是起到了很好的效果的话那我们就会去使用这样的数据去进行预测但是可能有一些问题比如说像您刚提到的比如说商场的这样一个数据那它是不是实时的我们能不能实时获取如果有其他的问题比如说今天商场有什么特殊情况导致停车停的多那这是

相当于我们模型需要考虑这些问题在我的理解这样的一些另类数据它其实会可能会受到一些其他因素的影响就比如说可能今天有其他事情导致它的数如果我们直接交易这样的数据可能会有一些出现偶发因素导致大瓦夫亏损是有这样的可能性的但是我们是有能力可以去处理这样的数据像您刚刚提到的量化交易的一个优势和缺点是什么首先

我理解如果在高频交易阶段量化是可以做一些毫秒秒级别的这样的一些快速的交易比如说我们池塘几十秒可能就完成了交易这样的一个快速交易人工可能是做不了的但是量化模型是可以考虑去做这样的事情的第二个就是纪律性它排除了人为情绪的干扰比如说追涨杀跌比如说今天大盘特别差

可能很多人他就去做止损去做割肉了量化模型可能会发现这个时间点正是我们入场的好时间这个是和人工交易比较大的一个区别然后第三点可能量化我们可以提前做好一些风险控制出现极端市场我们可能就可以自动进行一些止损的操作但它的缺点也挺明显的因为我们所有的模型都是基于历史数据获得的假如说

出现了一个黑天鹅事件从来没有发生的事件像比如说 2022 年俄乌战争在过去几十年其实没有这么大形成战争的事件那它对金融市场的数据就是一个重大的冲击那我们很多模型可能就在这个期间就失效因为历史中没有发生过这样的事情那我们用历史数据得到的模型是没有办法预测当下市场

那第二个就是可能有一个过度过拟合的问题就相当于我们在历史上回测的特别好但是试盘中会失效然后还有一个市场适应性的问题就比如说各家量化机构可能做出来的模型比较高度的相似度那如果这样的话是容易出现踩踏事件的就比如说

开始出现亏损一家开始卖然后他卖掉的股票呢又是其他家的持仓那其他家也亏损那其他家一亏损他也卖然后导致这样的一个连环踩踏事件那这个事件呢在美国是 2007 年有一个 Quantum Mail Down 事件然后包括去年 24 年 2 月份年初 A 股的小盘股上也是有类似的事件发生对对

这里边刚才 Lucas 提到了一个概念叫过拧合我觉得可能需要我们跟听众稍微展开的科普一下好的过拧合指的是模型在训练数据上表现得非常的好但是在新数据上可能表现得不佳这个呢简单举个例子比如说我们会发现之前贵州茅台如果看 2015 年之后它可能表现得非常好

到 2021 年达到最高点之后最近几年又表现不好假如我们一个模型在训练 2015 年到 2021 年的数据我们发现毛太好那我们可能会对它有一个归因我们可能会发现比如它的一个基本面指标体现它很好那我们得到的模型就是基本面越好股价越涨但是如果你训练数据训练的不好你可能会发现因为

因为它名字里带了贵州两个字然后我就会去学到是不是带这个字的就会表现得好对然后它里面又带了一个台字我们就看看 A 股里面是不是带台字的表现好就是可能最后学出来的东西它是不可解释的对这个在互联网也应该有类似的一个情况就是我们当时会

听到的一个故事就是把哈士奇和狼扔给深度学习模型去学习然后它在样本内学得特别好然后样本外完全失效了我们大家研究一下为什么因为大家会发现

他学到那个狼其实是学到那个照片里面有血所以这款模型学到其实假如里面有白色的东西比较多他就认为是狼没有白色东西比较多他就认为是哈士奇就这是一种明显的一个过女和行为对就相当于我想让他区分哈士奇还是狼那其实他学到的是这个图片里有没有血

对就是这个其实是一个过拟核的问题这里边它是不是一个一个性造比的概念就什么是真正真实有效的那个信息什么是噪音但是它可能模型最开始还是分辨不出来的对是的是的就是相当于金融市场呢会比传统的市场呢比较大的一个难点就是它里面的噪音含量是特别高的就比如说如果我们是在做一个

传统的人脸识别这样一个项目可能如果我们发现现在我们的模型对人脸识别准确率是 99%我们进行一些优化是可以有办法把它从 99%提高到 99.9%甚至更高但是在金融市场其实我们训练到一个模型有 50%多 60%的准确率

真正实际应用场景不会想办法把它从 60 提升到 80 提升到 90 而是我们会去确保它真是 60%因为假设如果真的能保证到 60%我们长期稳定的去交易这样的模型就其实已经可以带来非常高的收益了所以因为金融市场的噪音会非常多而且金融市场的数据其实在

过去几十年其实也没有那么多数据我按天级别几十年乘以每年两百多个样本点其实也就是几万个数据上的一个样本集啊

然后加上几千个股票可能也没有那么多的数据所以很大的一个概念是确保它是真实的一个模型而不是在学习历史上的一些噪音像我刚刚提到的比如像贵州茅台我如果发现里面带台子那这个股票表现就好历史上真的有这样的现象那我们就会认为它是一个噪音

所以像这样的一些就如何去区分是噪音还是真实的这个信息它是通过比如说我把音质总结出来之后通过人去进行逻辑上的判断还是通过一些其他的一些技术手段就这个部分就方便介绍一下吗这个其实各家公司对上面的理解是不太一样的有的公司可能他就认为我传特别高频的数据进模型里面去

然后模型学出来的如果我有严格的样本内样本外的区分相当于我学习的模型在样本外真实表现也很好跟样本内是一致的他就认为这个就是有效的但是这种一般我们都会传特别高频的数据比如说每 0.5 秒或者是更快的数据

进模型里面为什么需要一个很高频的数据呢就是我刚刚提到就是样本量越大过拟核的风险会越小明白就是增加样本量对吧对就是需要巨大的样本量然后去导致它学习的会更稳定一些所以这样的一个检验的模式也可以理解为它是一个相当于是被动的或者是一种算法式的

就不会去人工的去进行这种逻辑上的判断对 是的有的公司的理解就是我需要比如在因子上比如说我不传原始数据我需要通过人为的理解把它加工成一个特征这个特征是有一定的含义的然后我再把这些有含义的特征汇到模型里面去

那这个是不同的方法论其实大家对它的理解是不太一样的有的公司可能要求我最后端这个模型要有可解释性就是其实金融市场对可解释性是有一定要求的嗯对但是可能有的家对可解释性要求高有的家对可解释性的要求低哦

所以这个也就构成了虽然大家用的量化底层的方法论是相似的但是最终大家做出来的东西还是会有千变万化的区别对 是的那接下来一个问题我还蛮好奇的就是我们假设以中美两个资本市场为例那么量化机构或者是量化策略会在这两个市场里呈现出一些什么样的差异性吗因为直观上的感受会觉得美国的就是美股的这个市场它会是有一个比较好

的一个中长期的趋势但是它日常的波动波动率好像是会小于 A 股

我的理解是美国现在的市场整体的有效性是会高于 A 股的一个有效性的所以在一个有效性高的市场其实我们做量化的空间是会更小的所以现在美国其实量化竞争会非常的激烈像您刚刚提到了可能量化投资的成交额已经很高了 60%以上的这样一个比例在这样的比例情况下其实大家可以看到

大家都是机构嗯那机构和机构相互抢其实空间是比较小的所以现在目前美股如果单倍杠杆它可能一年也就三到五个点的收益是对但是可能各家会通过加一个三倍杠杆然后再减去一些杠杆的成本可能它可以到九到十个点这样的一个收益那目前 A 股市场的整体的单倍杠杆可能有的时候都有八个点九个点这样的一个情况嗯

当然 A 股加钢感的难度会大一些首先市场有效性的不同导致美国整体竞争会更激烈 A 股会更好做一些这个跟您刚刚提到的量化资金占比也是有关系的那现在整个量化交易的中国的政策态度是怎么样的呢是中性的呢正面的呢还是负面的呢就包括前段时间是不是有禁止量化交易这么回事

我的理解政策态度还是一个偏正面的态度总体来看的话监管部门也希望通过量化交易提升市场的有效性当然也会关注其带来的一些市场风险比如说在市场出现大跌的时候他们可能会限制一些特别高频的交易一些极端的抛售然后导致一些市场崩溃这块会做一些监管但是其实监管部门花了很多精力去各家量化机构调研发现

主流的量化机构其实交易的也没有很高频其实量化机构在 A 股又是一个坚定的做多的一方就是我们都是持有量化的多头对股票的多头对对对对然后我们这个资金变大呢其实也是在推着 A 股往上走的一个力量所以监管其实也没有一个很负面的一个态度但是它确实可能会特别高频的交易会有一些限制比如说就是你在盘口啊

两端各种挂那种虚假的单然后诱骗散户去做一些这样的交易可能现在在这样的一些交易行为上会有一些监管比如说你下单下的特别多后面的每一单都是需要收钱的这样就提高成本然后使得大家会发现你这样做其实没有收益因为有特别高的成本要花在

下去甲斑上通过这样的一些方式去限制特别高品的一些交易但是整体对量化的整个市场还是一个中性偏正面的一个态度那

那这里的话我们也替我们的听众提提问啊就是大家很关注的一个话题就是量化里边跟散户的这样的一个关系那既然私募基金的门槛是比较高的嘛那知道这些策略之后普通人有没有可能自己做量化或者说个人做量化相对机构来做量化的话是有优势的吗有没有可能有优势呢

好的我的理解是它的优势可能就体现在它资金量偏小那其实对市场的冲击影响会比较小那相当于如果我只要交易一个偏小的资金的话其实我可以很容易的在市场上完成成交但如果机构呢它一下交易一个一两百亿或者特别大的一个金额从出信号到完成交易可能都要花一天花两天中间的成本是比较高的

普通人尝试量化交易当然是可以的但是确实是需要一些门槛的比如说他需要会写代码会去找数据然后能把数据给清理好再有一些方法论上的一些研究包括现在其实很多比较稳定的量化策略其实是需要比较大的资金量的可能是需要我同时交易一两千只股票我才能获得比较稳定的收益不过只交易一只股票那收益也是波动非常大的普通人可能没有这样的一个资金量去做这样的事情

就是一方面是他自己的资源比较有限他自己做的话只能做一些比较简单的策略他的精力需要花在下载数据编程等各个方面还有最后下单而机构来做的话专门的人做某一环节肯定我们的研究深度各方面都会更好好很多所以听上来就是说

个人也可以做但是其实对这个人的各方面的要求也是非常高的就又得懂就是底层的这些构建模型的知识然后还得会优化交易然后还得自己量大因为量化本身做的是一个概率的事情我得就是不断地重复然后大量地重复然后才能获得一个概率上的一个结果

所以个人做听起来还是挺有难度的其实也不一定就是个人做如果他前面的知识都掌握的比较清楚他做一个高频的策略那可能他自己可以赚很多钱对但是这个前提是需要他真的做出来了

那在机构做呢机构相当于我们有很多人去分工分工然后那得到的一个效果可能会倾向于会更好但如果是一个完全没有掌握这个知识的人他就做量化他可能回测出来结果特别好他就会觉得哇我可能找到了财富密码这种情况挺普遍的对但是真正交易出来可能有各种各样的问题就像你说的刚才说的那个过拟合的问题对然后还有可能比如他没有考虑

一些成本比如说你到底是以对手盘买还是以自己的盘口买这是很多一些小问题就这些的误差就可能会在金融市场导致非常严重的回测上的不稳定的情况其实个人做呢可能需要他自己有一个比较长时间的一个试错然后他可能自己找到一套方法

但是如果一个人只是想通过快速的做这样的研究就想赚大钱那他可能发现出问题了调几次调不好那他就不想做这行就放弃了如果是一个比较浮躁想来赚大钱的心态个人做可能难度确实会偏大那机构做我们可能还是

比较能培养出一个人的量化思维吧就是他可以有一套成熟的研究思维那长期积累下来呢获得的收益还是很大所以你觉得量化机构是在收割散户吗这个问题可以问吗好的就是首先量化交易呢它的本质出发点并不是说我想去收割散户的但是可能确实在某些情况下

量化交易获得的一些收益确实来源于一个散户首先是这样的我们回到

为什么量化能在这个市场上赚钱的因素我们的出发点是市场有效性理论假如这个市场是完全有效的一个市场不管是量化和散户它都不应该能在这个市场上赚到钱就相当于它的价格已经把所有的信息都反映了但是事实的真实的一个市场至少在某些维度它是无效的正因为有这个无效性量化就能在历史数据中找到这个规律就发现它在这个维度是无效的

那我们它既然在这个维度上无效的那我们就是有盈利空间的就相当于比如说这个股价现在是 10 块钱我们通过模型发现它应该值 15 块钱那我们在 10 块钱的时候做多把它推到 15 块钱这个过程呢就是把一个股票从 10 块钱这样一个无效的价格推向 15 块钱有效的价格所以量化的最理想的盈利场景是把它从无效推向有效的一个过程然后获得收益那反过来假如说这个股票

他只值 10 块钱他现在已经涨到 15 块钱了量化机构会做的事情是尝试去做空把它从 15 块钱砸到 10 块钱在我们的理解中 10 块钱是最有效的一个市场价格比如说像之前川普上任这个事件中 A 股有个股票叫川大致胜因为他又川大就是跟川普有关系还致胜这样的一个名字川普概念股川普概念股

还有什么哈里斯概念五当时就是川普概念五大涨那哈里斯概念五就大跌对然后在这个过程中呢川大之盛呢其实是迎来了一些涨停就是比如说在那段时间涨了百分之三四十个点那这样的一个过程呢如果我们从基本面或者从各个其他维度去分析它不应该获得这个上涨是对但是因为当时散户发现哎呀

它既然涨了那我也跟各个机构可能去做了这样的一个行为这是一个情绪上的非理性的一个交易行为导致了它的股票的上涨那如果是一个量化机构我发现它的价格它不应该涨那我就会在那个位置卖出甚至做空把它给

砸下来砸下来之后他的价格重新回归理性之后那对于一个散户来说他肯定是不开心的他说我买进去了然后你们量化在收割我把这个价格也砸下来了那其实对于量化来说他觉得我是在推动市场走向有效你这个波动就是错的你不应该有这样一个异常的波动那

这个行为我的理解它不叫收割它是一个量化的本质是想把它从无效推向有效它在做这个过程中一些非理性的投资行为被收割或者是亏损我觉得是不能叫收割散户的这样一个行为所以这个是一个行为偏差就相当于是散户的一些非理性的行为像追涨杀跌

比如说一个股价大跌但是我们发现它其实已经跌破它的合理价格了量化机构可能会去买入散户往往就是抛售

像我刚刚提到的穿搭之身这种情况就是反过来我们的算法会在高位进行迈出然后散户可能在这个点进入就是量化交易呢这样的行为其实有点像工业革命期间比如说一个工业化生产对一个手工生产的一个替代的一个过程散户有可能反过来割量化吗这个打引号的割啊或者是说散户的什么样的一些操作行为相比起量化来讲是更有优势的这个呢我的理解呢首先

量化交易还有点像是比如说我去做玉石菜这样的一个行为量化其实我是通过大数据我去交易几千个票它的一个缺点其实就是我不可能在每个票上我都预测得很精准我也不可能有很深入的对它的一个研究

散户如果他从基本面角度分析他其实可以深入了解一个公司我可以去每个公司比如我对这个公司特别感觉我现在实际考察我去找他们的员工吃饭或是通过这样的一些行为去真正的了解一家公司这是散户有能力做的而量化机构我同时管理几千个票我是没有能力去做这样的事情的其实散户是通过这个维度它是可以比量化机构更了解某一只股票或者某一些股票

那在这个情况下呢它有点像玉汁菜和大厨炒菜的一个区别对那量化就像做一个玉汁菜我先我知道大众的口味是这样的我就先这么做做出来呢反正我也能确保它安全我能确保它什么它不会有一个大问题就这个菜你肯定可以吃也还行对但是口味呢肯定不如

一个大厨真正炒出来的我知道一些很多这个菜的特点炒出来的那个菜那肯定是不如的散户呢如果你真正能对一个五条有个深入的研究

其实也不能说散户或者是一些主观机构投资对就听上去更像是量化和基本面这两种交易方式或者是交易风格之间的一个差异就是像量化在基本面上的研究我们也只能说比如说我把所有的公司列出来我看到这些指标

通过这些指标大概给一个打分但这个打分可能不适用于其中一些股票是完全有可能的或者就是说这些打分它反映的是过去的信息它能反映未来的信息吗比如说从量化的角度一些基本面的一些因子你们会去通过这些基本面的因子去推导它未来的还是说它仅仅就是反映了

已经发生的事情就相当于我们可能是看到目前财报的一个情况对我们通过这个财报预测下一个周期比如下几个月的一个股价的涨低这个东西在历史上有效未来也不一定有效比如说经济大环境变了是未来什么人口的因素什么或者医疗的因素这种各种因素人和老民化的因素导致其实在历史上的这些模型在未来也不一定有效

但像这些逻辑从量化角度他从数据取导他很难去把握这样的数据如果一个散户他非常了解比如他就知道这家公司就要扭亏为赢了对他就知道比如说在未来的人口老龄化或者人口变少的一个时代什么样的行业就是有价值这个在量化是做不了的一个散户是有能力去做的对

所以打败量化的方式就是更深入的研究我个人是这么理解的另辟蹊径对但是如果你想同理就是比如说你有特别好的技术比如说市场上有一些油资对所以其实你刚才在聊就是量化和散户之间收割的关系其实我我刚想问的是说量化是收割油资吗

收割油资对啊因为油资其实你像比如说像穿大之盛这样虽然会有里面会有散户的一些跟风或者情绪的行为但是实际上我不太清楚就背后是不是其实有一些比较大的这种油资那他其实也很清楚市场整体的一个集体行为他可能会对一些无厘头的或者是一些什么样的东西就会有一个追涨杀跌的行为那他在背后可以说是带节奏或者是就是主导了一个这样的一个趋势那所以其实听起来好像

这样的油资跟量化之间更像是一个交易对手的感觉是的量化市场就是量化交易基金的变多其实直观就导致了油资那边的利润会少我看到很多比如说或者是一些评论区喷量化的我看起来很多就像是那种跑短线的油资对因为他们会觉得以前很有效所以你现在的行为

对但是游资之前的行为是不是也在隔散户呢对其实是一样的当然游资比如他可能通过消息面对某一个票上精准的涨跌超那是量化做不了的但如果你是整体是一个大面就是相当于如果你的研究并没有对某一个股票有特别深入的研究还是一个泛泛的研究如果对于游资来说那我觉得他可能是

是没有量化有竞争力的但他如果比如说他有消息或者有什么各种各样的东西他对一个股票就是有很精准的把握那可能油资可能在这上面还是有优势就是量化的优势还是一个我是一个大面上整体比如说每个预测就是就大数据里的规律对就是找到一个规律对但是油资可能就是他一两个点他特别准他就赚了很多对

我们节目一开始就提到了这个 DeepSeek 书宣然后包括背后的这个换方这也是为什么我们做这一期节目的一个初衷啊那所以我们很好奇就今天这个大模型它

有没有运用到我们今天的量化的这个交易里面来或者换句话说换方他是不是在用 DeepSick 炒股这个首先他们有没有 DeepSick 在炒股那我肯定是不知道的对但是首先大模型的应用呢我们从 ChadGBT 时期其实已经在用了其实对我们量化最直接的帮助

就是他可以帮我们写一些代码然后使我们的有 idea 到最后的交易那个过程会变快然后他的一个很大的帮助就比如像我之前也提到的比如像古巴这样的一些数据情绪打分如果我们用旧的方法那就是比如说我们去数关键词其中里面有好长那个词就是好的词然后跌什么那就坏的词那这样的模式他其中有的时候呢

它有一些比如说写的不好你一个识别起来或者它用一些更委婉的表达你不太能很好地识别这些关键词就会有这样的问题那大模型呢因为它整体它对整个这个语料的一些分析还是会比人工会高所以说处理一些非结构化的数据就像文本啊图像去做这样的数据呢大模型是有明显的优势的当然它也可以去通过财报啊快速去

去抓取它的财报到底是好还是坏对这个数据抓取这些都是有比较大的优势的但是换方有没有用 DeepSig 炒股呢就像我之前提到的最大的问题就是过拟核问题是非常严重的不知道你们有没有自己在本地部署过那个 DeepSig 比如它有什么 60B 或者是多少 BB 的意思就是 Billion 就是几十亿 60B 那就是 600 亿个参数那像这样的模型呢

因为要 600 亿个参数它需要的样本点去年这个模型那就要更多了这个在语言或者这种类型中是可以去实现的但是在金融数据中我把过去几百年的数据喂给他他都没有这么多没有这么多数据所以数据量少导致金融市场

其实是使用大模型这个模式直接出一些结果它的效果不太稳定可能它可以处理像我刚提到的文本数据因为这个还有我们有足够的数据去支持这个文本到底是好还是坏我给它一个打分这种是可以的但这个打分是不是能直接很好的预测股票涨跌这个不太一定对

大模型本身是一个未来量化中会花很多时间去探索的一个方向因为它确实很高效的可以提高我们的研究能力和研究效率但是确实它是不是直接能使用目前我的理解是还是有比较大的难度的跟样本点有一个关系也像之前提到的金融数据里面噪音还是太多了他可能学到的东西

就是像之前提到的可能就是把贵州两个字给学去了这个在大模型里是可能会发生这样的问题听起来它现在在目前你们这边的应用的话还是集中在前面这个数据准备的这个阶段就比如说我信息的这个抓取然后文本的这个处理就这个跟

它是不是在量化好像没什么太大关系就比如在其他领域我是做一个研究的我是要处理大量的一些信息和文本我同样也是使用的这个路径对其实在这部分起作用而已对吗就我的理解是在这样的应用场景它是可以很明显的带来研究效率的提升的但是在后端的一些研究场景它能不能提升可能各家有各家不同的理解可能有的公司已经把那条路走通了

我也不太清楚这个对但是这个环节大家对大模型的理解不同他可能有的公司他们自己有能力就训练大模型可能他们有一个特异化的训练方式

那可能他们走通了那可能大部分公司并不一定走通这条路就是我刚提到的数据量不够对那比如说有些公司他就有特别的那个加工数据的方式那他可能可以把这条路走通对就想到一句话叫做那个 gap is in, gap is out

对对对对吧就是你就是你喂进去了什么东西然后它产出什么样的东西所以其实刚才 Lucas 提的就是有一点我觉得就是还挺启发我的就是因为现在的金融里面的数据太少了所以即使这个模型它是一个很好的模型

但是我喂给他的东西不够多所以我很难输出非常有效的内容说到这儿我有一个自己的好奇就是你自己觉得量化的模型和比如说互联网领域很典型的大数据应用场景下比如搜索推荐广告的这个模型它的从复杂性上来讲你觉得哪个更复杂一点我觉得

我直观的感觉我会觉得搜推广的那个模型会更加的复杂一些对吧它能够有海量的数据并且它对于工程的那个要求高频发展这些要求都很高这是一个直观上我觉得它更加复杂一些但好像量化的那个模型它也有自己的这个复杂度比如说就你们建模可能会很难

因为过拟横的那个问题所以你们建模会很难哦明白对包括还有什么你们对于那个风险控制的要求会更高吗对对对对对哦我明白了其实我理解互联网的模型对可解讯性要求没那么高训练过程中要求不是很高嗯对就相当于我可能训练出来然后用几个指标去对它进行打分嗯然后打出来的那个分可能就是去评价它的模型的好坏

可能有的时候你做一个迭代实际使用起来表现变差了其实也没太大的影响我是这么理解的但是金融市场呢其实会复杂一些就是因为我要验证它有没有效就是在市场上的交易去看看它的收益情况就假如我的模型弄得特别复杂

比如说叠非常多层的神经网络或者是这样的一些大模型的东西出来的东西我完全不知道是什么情况然后来一个异常的行情那可能就出现了大量的亏损所以量化模型不会那么难但是训练模型过程中它需要很多鲜艳的假设或者鲜艳的知识带进模型里面常见的就是如果你直接训练未来的

比如说我就训练未来股价的涨跌非常容易过离合可能你稍微一训练它马上就过离合我们甚至不用上神经网络用一些更简单一些的模型像机器学习模型它就过离合了那出现这种情况怎么办呢我们可能是需要去比如说对我们训练的 Y 进行一些改变就是我们不能直接训练股票的涨跌而我要训练可能股票的相对强度

对就是会有这样的很多改变包括什么一些风格的控制啊各方面的一些控制就是嗯就你们对于可解释性的要求很高对首先他对可解释性还是有一定要求的就是我不能交易一个我完全控制不了的东西嗯因为你交易这样的东西真亏钱了假设交易亏了我也不知道要怎么改说实在那我应该怎么迭代他呢我也不知道那我是

继续交易它还是不交易它呢其实对于一个基因经理来说他是没有办法做决策的因为我不知道他到底在交易什么东西但是就是他的难度可能是不是在模型我要训练的多深多复杂而是我要怎么去控制我输入的东西和我预测的这个值他的难点并不是模型的训练上而是我要知道我要喂给他什么数据我需要对数据做哪些预处理

难点可能是在前端的一些处理上对它不是在模型我要训练的有多深这个问题上我觉得是这样的就是其实在一些头部公司它是有举办一些量化相关的比赛的我知道你有关注是对

比如说一些预测的比赛当时挺有意思的就是拿历史数据给到他们去预测然后选出来前几十名比如说他有一万个参赛队吧看这些人的排名吧他训练的模型的排名然后结束之后拿到真实未来几个月的数据去测会发现在真实中表现最好的那几十个人在之前的训练中都排名挺靠后的反而之前

要么那排名特别好的那些人在真实的数据中就到了一个比较糟糕的水平了这说明其实市场的真实情况的波动其实是非常大的它没有一个很稳健的模型就是在这段时间训练的好然后真实交易又很好其实挺难的就比如说在金融市场交易中其实是会出现一个自我实现的一个过程就相当于当一个东西价格在上涨之后

投资他的人当然赚了没有投资他的人看到这个人赚了他们也想越来越去试一下他们这笔新钱的加入会导致价格进一步的上涨进一步的上涨这个人又会告诉更多人这个可以赚钱的

随着这样的不断的这样子一个水涨船高的过程可能一个金融价格就会被推得特别高这个过程在金融市场挺常见就是一个自我实现的过程但是所有的自我实现会造成一个泡沫其实

历史上的郁金香泡沫其实跟这个也是一回事那一旦最后大家回归理性或者出现一些意外那整个泡沫就会进行一个崩盘那在这个过程中的很多数据其实都是可能就是它是噪音或者是什么也好或者在历史中在未来是无法去复现历史结果的一个情况所以很多金融规律呢变化也比较大是的

像我就是随便说就是比如像用 DeepSeek 的时候我一个互联网的同事跟我分享的一个案例就是他把一个图片传给 DeepSeek 然后说里面有多少个人给了一个数然后他就问一句你再看看呢然后 DeepSeek 马上给你换了一个数然后他试了六次 DeepSeek 给了六个数他说真实答案是在这六个中

出现了但是问题是假如你这么一给反馈他出六个答案你也不知道哪个是真的就是你实际是怎么使用的就是这是大模型中可能一些问题大模型给你答案然后人你在作业筛选可能你先把它选出来了但在量化交易中你可不能这么交易因为你一交易那五个错误答案那就是直接亏钱了那作为一个量化研究员你怎么来看待 DeepSick 的大伙呢

我了解 23 年我就听说了换方在做这件事情但是确实到今年他今年一二月份他出来之后我才知道我原来他们已经做得这么好了其实他前期已经投入很多成本是的其实我也知道其实好几个同行投顾也在做这个事情

是吗除了换方之外还有对其实二三年我就听说了但是他们有的没有做出来据我所知的是因为换方其实是没有一个明确的一个 KPI 就是我需要的模型这个月表现出什么样而其他公司可能有点互联网化他有点要求我做这个东西的成本是多少我这个月必须要有多少产出

其实我感觉像 DeepSeek 这样的一个东西换方梁文宏他在这上面的一些投入更像是他的一个性怀对一个情怀兴趣我就想做这件事情可能对梁文宏来说他在量化市场已经赚足够多的钱了他只想用这个东西去实现真正能造福人类或者是造福为了中国的科技发展去做一些事情

而如果你是出一个利益角度来说的话可能有些其他的公司它是我需要有明确的 KPI 你这个月就得比上个月提升多少反正这样做下去你会发现做几个月会发现没啥用然后你就会把这个项目给停掉其实我很好奇量化公司为什么要来开发大模型呢开发大模型对于量化来说最直接的作用或者是立竿见影的好处是什么呢

这个我只能表达我个人的可能的一个理解首先大家其实

特别头部的公司都储备了非常多的卡一万张以上肯定是都有的其实作量化不需要那么多卡是就是可能你用一点就那个模型和你用一大堆训练出来的差不多真实交易的结果是差不多那剩下这些东西卡他们总要去做点什么事情就这样子吗这是我的一种理解可能跟真实情况并不完全一样但我相信这肯定是一个因素对的但是他的

又回到一个更前置的问题就是他既然没有一个很明确的目的他存卡干啥

做投资用吗最开始大家就认为我囤这个卡一定会有用对就是一个军备竞赛的一个过程就是我反正不管未来怎么样或者我现在还补法预判会发什么队友但是我知道一定要囤对然后他囤了然后就真的可能大家囤了那么多卡做研究会发现用不着模型不要那么复杂那么复杂的模型反而效果不好其实有很多是用不着的

那这样的话对他们来说去做做大模型然后去做做这样的一些算力平台其实对他们来说是一个顺其自然的一个过程按你这么说那几个头部量化都有很多卡是的对据我了解是的这应该不算行业机密吧没有什么行业机密只是我们这个行外人不知道我知道的肯定有好几家公司有特别多的卡

特别多是就是万是组上万吧是 benchmark 吗对吧上万吧对肯定是大于二的 OK 至少有两家以上有这么多卡的好的大模型呢首先本身它是一个另外的一个赛道因为量化这个行业呢说白了其实它更像还是就包括梁文峰之前上的那个

那个什么会议就是你是说很高层的那个会对梁永上那个很高层的会议他的身份他是以 DeepSick 创始人去的他不可能是以换方创始人去的对就是相当于这个还是 DeepSick 是一个比换方要更高的一个东西因为换方他服务的其实是他的投资他的人对而 DeepSick 他是可以服务到每个人整个社会吗对那这个他去做这件事情首先是有

有他的社会责任我的理解是像其实他之前 22 年和 23 年捐了 1.38 个亿这个应该也都知道我的理解他很纯粹啊也是真的想为社会对而且是有一点有这个社会责任他也去愿意承担的对我反正我觉得换方至少或者是 Deep Seeker 在这上面是做了非常多的工作

工作的像您刚刚提到的就是我怎么去看待这个 DeepSig 的大伙那我理解是他们的那么那么多卡

去训练这个大模型是有他们的能力在的对包括我看过梁文峰的一些采访啊他是说他找加入 DeepSeek 的人是要找那种特别热爱这个行业的有很强烈的兴趣的人然后别人问他那你找这个行业的找这样的人好找吗就是找这样相同就是找这样志同道合的人好找吗那梁文峰说哦

这样的人往往也在找我是对我觉得这个是一个非常好的一个环节双向温富双向温富的一个感觉那其实就是他给想做大模型的人提供了一个平台提供了一个场景然后这些人也去那里给他了一个很大的回馈然后双方也都实现了利益的共同的

价值然后也从中都有收获我觉得这个是一个工作形态中最理想的也是最好的一个形态而且他们还不太卡 KPI 所以给了大家很多自由度其实也有点像在做科研所以我觉得

Deep Seek 做成这些事情还是有非常多的就是背后还是下了非常多的功夫的包括他们企业文化上对对对对是就我们之前其实也聊过过嘛就怎么去实现创新首先你把一群最顶尖的聪明人聚集在一起然后不要加以干预给他空间然后等待创新自然发生是

非常理想化但是确实我相信其实你知道我后来录完 Deep Seek 之后我又想到我们最开始录 3M3M 不是也各种创新吗各种它里面不就有一个 15%是 15%原则对 15%原则其实都是通过这种方式去管理创新包括你在地气节目里面谷歌 20%反正差不多反正就是你得留一些空间给到创新对

我了解的是目前又有不少新的机构其他机构也开始想去做大模型了对这个也是你说的机构都是质量化是吧对量化机构

不是你们现在没有什么作用吗后来作用不明显他们也囤了很多卡是吧囤了也囤着干点事吧卖算力是吗对啊这个确实不太清楚了反正就是量化机构开始研发大模型这个事也开始要有那个星火燎原之势了对肯定是有一些公司开始

新的在尝试这个方向所以我大模型的赛道就是除了传统的科技公司之外量化对也卷进来了嗯挺好的对但我我的理解是训练大模型和训练量化模型其实差异还是很大的嗯就像大模型可能我要找到更多的数据嗯然后

喂给他然后预处理可能不需要那么多当然肯定也需要一些打标签或者之类的一些行为预处理没有那么多然后就靠足够大的算力去把它算出来然后量化呢还是需要可解释性比较高所以算力其实要求没有那么高但是我需要对他提前有很多预处理过程

或者是有一些风控的过程就是出来结果之后我要过很多风控的一些标准就是量化对可解释性的要求还是很高就这个现象在国外普遍吗比如说美国的量化大厂开始搞这个真空智能的东西这个确实不太了解好像没听到什么新闻那

如果今天不是跟 Nukes 聊的话我们也不知道量化的头部其实其他家也在搞大模型我了解是在搞但是好像没有搞成 23 年开始就听说过好几家在弄多汉方其实对大模型的投入是很早很早

很好听到就他们肯定是好多好多年了是的就是二三年我是非常明确的听到了对二三年只是可能他积累的很多东西就是开始有一些成果出来了不是就是我就听说的

开始招人啊什么的就是各方人对对对听说了因为他们那个搞那个超算就已经是很早的事情了对对对但是如果你看业绩就可能对没有就是没有什么相关其实就你刚才说的大模型其实不太能够直接用作用到量化是对因为如果您看业绩您可能会能看到一些新闻其实换方的资管规模在掉在缩减而且缩减的挺厉害的他们的业绩也

有比较明显的变差的一个机器就是它这个其实也是和规模有关是吧就规模太大了也交易不了那么多钱或者他们会发现

搞量化其实对他们公司来说你搞搞自营就够了也不需要资管他们自营赚的钱去支持大模型服务更多的人对他们来对于梁文峰来说他实现他的个人价值会比把量化做好有更大的社会价值是的对

那说到这儿我们再聊点行业八卦就大模型这波其实一些顶尖的算法人才的薪资还是水涨船高的就过往比如我们会遇到一些候选人同时手里有量化的 offer 然后有一些互联网公司的 offer 然后还是都会倾向去量化那现在这一波这种市场的薪酬市场的新的影响你们会感受到吗会对你们招人会有影响吗

我的理解的话在互联网做大模型或者他同时拿到量化 offer 的人更像是做一些深度学习或者是一些更像是一些做深度学习的人这样的人的话首先基本上国内量化机构也只有顶级大厂才能出比较大的包能跟互联网去进行一个

匹配吧据我了解的话首先像的人国内招聘的需求其实量化市场应该不多可能所有的量化机构加起来可能一年也就几十个二三十个有可能能达到那个标准的人不太多吧对当然他们可能同理也会去投互联网大厂因为他们都想看一下如果做成了的话量化的薪酬的想象空间还是确实是很大的

对但是现在整体的话确实难度也比较大像一些非常大的头部的量化公司其实它新储备了非常多人才可能进去发现也作用不大大模型毕竟因为我确实不太了解大模型的奖金的一个上限会是一个什么范畴

我感觉量化可能没有那么压力没有那么大就是加班会少一些然后且有一些想象空间奖金的想象空间那可能对一些顶尖的人才来说呢

他想轻松一点也多赚点钱他可能就会去选择做量化这个行业但是如果他对技术上比如说他就想搞大模型或者是他就想去在模型上或者在计算机算力上做一些持续的研究或者更深入的一些追求的人那他可能会更倾向于去选择大模型这一块

我听说就头部的量化公司就对于保密性要求非常高嘛就是如果有员工离职的话是说一年半到两年的时间之内第一肯定是不能去其他公司任职然后第二自己也不允许交易是有这样的事吗就是进业嘛那进业的话国外应该是肯定是就至少 12 个月吧我理解是就是国外的

离职经业期国内的话呢原则上是这样的对但是就还好原则上肯定是有一个经业期的对对对但是会不会有什么其他手段去规避这个

就不太敢去评价了是会全员都经验那首先全员经验不会的因为经验毕竟还要给钱对如果一个人他本身也没什么贡献的话大家和平的聊完和平的离开其实应该还好对但是也有给经验很强的就我了解有的那种比如说你入行半年做不太出来被裁了然后再给个两年经验那你相当于就

基本上就要告别这个行业了当然也没什么毕竟这两年还有钱拿的你可以去做互联网你不需要干两话原来我们是你们的 plan B 对于某些人来说是可能是这样的但确实你们的经验就是好长太长了一年半到两年太长了应该也没有那么长有的半年也有半年也有的对都有互联网会有这么严格的经验吗

首先时间周期不会那么长也是有进业的有进业但同样是对于核心港它不会是说这种特别夸张真的是全公司的全员但是对于核心港核心部门有可能覆盖率是比较高的然后时间也没有那么长时间也就半年吧有一些可能到一年但是像亮话中说一年半两年我觉得太夸张了对于有给两年这是我确实是知道的

我感觉量化的圈子好像跟这个传统金融圈是不是也有点区隔区隔大了就是有听说说你们会跟传统金融行业去保持一些距离包括 office 都不会放在一起就北京的量化公司的办公室可能是在海淀他不会放到国贸啊金融街啊这种地方去对就是

应该在清华科技园那边非常多甚至那一片我就知道得有七八家离人才很近对就是因为清北就在边上对然后这不因为跟人才来源有关系是吗对而且我觉得量化的就量化它更像是一个科技公司它只是把科技运用在了金融的领域但是它对我觉得底层的基因是一个科技公司的基因它不是一个

就是不是一个传统金融的概念对其实我们好像没有不像太多的金融行业那样就包括如果您看到我们日常穿着那都特别随意是对就是也不会说天天西装领带的那种模式去工作的是对就是大家都比较随意然后更像是一个在做科研的一个状态就是在做读个博做个科研这样的一个状态在工作

放到清华科技园基本上是因为那边

学生进来实习也很方便是对然后很多人也做一些日常实习就过去了对前面也提到了很多量化是怎么做投资然后做研究的其实也很好奇一下 Lucas 作为量化的资深从业者你自己平时做投资的时候会是一个什么样的风格然后会不会受到很多量化的方法论或者是一些原则的一些影响对好奇一下其实我觉得

量化研究对我的一个个人投资的一个观点影响还是非常非常非常多的就是首先我现在的理解呢投资这件事情的核心还是一个看个人的一个认知水平就是你有多少认知去赚多少的钱非常不同因为金融圈我觉得最核心的一个问题就是你承担多少风险

然后你就能获得什么样的回报这个风险带来的一个付价对对那其实它的一个很大的点就是你能承担这个风险你真的能承担这个风险就比如说我研究了一个股票假如我只是简单的看了一下这个股票然后我就去买入它那么第二天它瞬间大跌了那我可能会觉得哎呀是不是我之前的理解错了那我可能考虑的是把它卖出我止损了如果它

我真的非常深入的了解了这个公司那它大跌了以后那我的想法是买入对我买入我可以减更便宜的筹码它未来上涨我可以赚更多的钱就这个差异就取决于你个人的一个认知的一个事情对就是你个人有多少认知你能赚到多少收益做量化的人会非常看重这个

投资的一个风险因为我们每天做因子做什么的其实都在考虑怎么去平衡收益和风险的事情是对那可能我个人的理解呢目前超长期的看就是看运气了如果你在一个好的时代那你可能长期复利到 20%也基本上就是一个极限的状态了比如说像改革开放时期当时有非常多的机会如果你长期看的话可能每年是一个 20%左右的一个复利如果你是

比如现在社会跟其他一个存量的一个投资增量没有那么多了我个人理解长期看就是一个 10%左右的一个机会但是这样一个 10%可能是今年 30%明年负百分之多少但是如果你的认知就是我长期看就是 10%的

投资收益那可能比如某一年亏 30%你也能接受嗯因为我目标是一个很长期的一个过程对然后投资呢我的理解就是一个做正期望的事情对然后我们我自己会做的特别多的就是对我的投资进行一个归因啊对就比如说如果我买嗯我们量化在股票市场上应用就是指数增强嗯这种策略比较多嗯

指数增强其实它是有两部分收益的就是指数的涨跌和增强对其实比如说某一年指数跌特别多我肯定是亏钱的但是我如果看到增强部分还挺稳健我是愿意去承担风险的因为我的理解是指数现在跌了它未来总要涨回来对但是增强的部分那就是开了兜里的钱是对就算绝对数值是跌那我也是愿意去做这样的一些方法

然后因为我自己呢对量化的一些规律可能了解的会多一些吧就可能我自己投资的会稍微激进一些对那这激进的就比如说我可以买一些高波动的一些指数

对其实这一点我还就是也挺好奇的就是说高波动和你刚才提到的量化规律他们之间到底是一个什么样的关系其实我的理解是为什么有那个量化规律的存在就是因为在高波动的情况下有些人他不了解这个市场他就止损离开了因为他们的止损离开所以他会他会涨回去哦

就是相当于止损离开的人他就把这个钱贡献留在这个市场了那你能坚持下去你就可以获得这个收益就包括我们从我个人的角度就比如说这个市场什么叫

大热必死这个事情包括一些主观机构主观投资有很多这种情况 21 年之前特别好 21 到 24 年 25 年非常糟糕反而如果大家现在对这个东西就很骂得很厉害都不看好反而它是一个投资机会对其实我相信所有的这个复利的收益往往就来源于别人认知不够所以他们会做一些止损他们会

放弃做这个正期望的事情那你坚持下去了你就能获得这个收益那我还想再追问一下那你怎么去看待这种止损和前面提到的风险控制之间的关系呢我明白你的意思就是相当于您可能觉得止损它可能是来自风控的一种风控的措施吗对我的理解就是还是你的认知问题比如说你现在发现这个市场已经偏离了你的

正常认知你把它卖了那其实我觉得是 OK 的但是如果市场又回复了正常状态你会把它买回来而我刚刚说的离开市场就是他的认知不够他认知不够出现大劫之后他就卖了钱

当恢复正常了他不想买回来他会觉得之前好痛苦我买这个亏了这个把我坑过了未来还会坑我明白其实对应到股票市场中还是挺怎么说就是很常见的一个例子比如说过去的一段时间的熊市然后大家都很痛苦那么很多人就说我再也不买回来我割肉了对然后市场好了之后

他其实他又会改变他的想法说市场又很好了我一定要去参与进去所以容易造成一个追涨杀跌的一个效果对是的是的嗯就是如果你长期看的话去年八九月份是一个很好的投资 A 股的时间你站今天角度来看那时候是历史第一位是但是我也是经历过那个阶段的在那个点

我做的操作是没加仓也没减仓就是我确实也不太敢加但是我的一些投资观点让我不会在那个位置减仓因为我觉得长期一定会涨回去虽然我不知道要过多长时间涨回去但是那个位置我不能割肉明白就是说以及你前面提到的本身的高波动你对高波动的一个偏好其实谈谈谈的一个道理是说高波动本身就反映了市场的一种无效

对对吧所以在这个里面其实其实你是能够拿到一些超额就是更好的一些超额回报对是的是的就是相当于波动越大你抄底的话获得的收益空间会更大对对但是这个还是取决于大家的认知就是我的认知是我觉得

差的话一年十个点的长期复利这个其实是一个非常高的标准对其实是很高的但我相信如果我能持续做一些正期望的事情是可以做到这件事情但是它确实难度挺大难度挺大而且它不是一个稳健的十个点那中间的波动是巨大的是的但是从我个人角度因为我有这个观点所以我可以坚持做这件事情因为我知道很多人坚持不了这个事情那我坚持它我就有收益是

其实我觉得这个金融市场不是说你要做多准而是你能战胜大部分人你就应该是一个还可以的因为整个社会的经济毕竟还是在往上走的就是长期的这种理性乐观是不是有一些乐观是吧你相信经济往上走吗那当然是乐观或者他不能说

是一个持续萎靡的如果这种情况发生了怎么办如果像日本那样怎么办就反过来说如果你看巴菲特的案例 1970 年 80 年那个年代美国的经济也非常差对但是巴菲特坚持下来了当时很多票市盈利跌到 10 倍以下了

他坚持下来了后面就获得了还是很高的收益所以刚才 Lucas 的很多个人投资方面的一些经验其实也很值得广大的这个个人投资者学习借鉴对学习借鉴来自于量化研究员的专业指导现身说法对对对嗯

也没有就还是强调一下就是所有的投资可能还是需要你确实能理解到这层面是你就能坚持下来是如果你只是按照我的一些操作去做出现亏损了对你坚持不下去那可能就那也是招猫怕虎就还是本身对这个事情的一个理解一个认知的情况对对对行啊今天也非常的感谢 Lucas 对专程来这边跟我们录这个节目是好呀那我们这期节目就放到这边