
对话国信证券王开上篇|如何给大模型提一个“好问题”?
点击报名本场大师课《DeepSeek重构策略投资新范式》
以下是华尔街见闻6月26日采访王开的实录:
用DeepSeek做投研,是未来的发展趋势吗?王开:我最早是做宏观和固收研究,后面聚焦于A股策略以及资产配置,那么对于我们这类人,比如说最基础的股债的之间的一个轮动,我们之前可能用自己的一套定性的范式,结合我们客户交流的一个反馈达到定量的配置效果,在这个里面,无论我们卖方给观点,还是在买方做这个配置也好,都无可避免的会有一些自己主观的判断成分,大模型它其实可以给我们更加客观的判断逻辑,这点其实是在我们的投资还有投研生涯里面比较关键的一点,再加上今年我们国产的DeepSeek为代表的大模型实现了弯道超车以更为优厚的成本来实现对美国大模型的一些平替,所以它给我们,应该说不只是金融行业方方面面,各行各业的一个工作范式,成长逻辑都有一些新的转变,我们体会的还是以这种自有的思维,自有的一些框架来配合大模型,尽早地去拥抱它,把它当成一个比较好的工具来为我们所用,这个是我们今年以来孜孜不倦在做的探索。
如何运用AI寻找 Alpha的大行情?王开:在过去的很多年时间里,我们看到有很多知名的投资产品和模式,可以挖掘出一些Alpha的标的,形成非常陡峭化的投资回报率的实现。但其实对于很多大部分的投资人,如果我们的投研精力分配比较有限,同时又喜欢在金融市场里面,去做一些相关投资,那么选取这种被动型投资,是符合我们大多数投资者偏好的工具,其实大模型就是给我们提供了这样的一个契机,我们作为普通投资人参与金融市场,更多还是在信息的一些跟踪,包括在模型的热点选取上,利用它的文本挖掘和捕捉能力,以及它对非标准化数据的处理 提炼和概括,其实能够满足我们大多数人的投研偏好。
未来卖方研究工作会被逐渐取代吗?王开:今年在DeepSeek为代表的大模型和投研结合的一些研究上,最重要的一点:它是加快了我们整个行业的更加陡峭化学习曲线的逻辑,研究一直是很重要的,有效的研究一直是稀缺供给,AI大模型可以提供的帮助,比如说搜集一些市场观点:给出一些比较合理的价值跟踪的导向,应该说是加大了我们在信息的海洋里,或者在一个信息爆炸的空间里面,去获得每个投资者他最关注的信息,最有价值的信息的一个效率工具,确实我们之前可能会看到,很多主观性的一些观点会提供投资决策,但这一点其实也是立足于,比如说过去数十年,或者说最近几年,崭新的一个在资本市场里面,深耕的心得和模式,我们对市场深度的思考和理解,这个范式它永不过时,那么大模型的话,就是怎么样把我们这种思维的沉淀,来落地到我们投资的决策里面来,落地到最后一公里,它其实起到了一个非常好的,辅助增厚的帮助,
个人如何构建可使用的AI决策体系?王开:我们今天关于AI有一个口号,这是我们的研究心得,即从之前的算力平权转向投研平权——很多普通投资者没有足够的时间和精力放在盯盘,以及跟踪投资交易相关的新闻上。而大模型在这方面能很好地提供工具支持,比如可以对新闻媒体、分析师的观点进行提纲挈领的梳理,按照投资者自身的偏好或资产组合情况,输出和浓缩相关内容,在这一点上,大模型的效果非常好。
同时,以知识库为例,投资者可能自己有一些研报、积累的学术素材或研究成果,将这些上升到自身知识库的维度后,当想要了解自己感兴趣的主题时,就可以让大模型帮忙提炼总结。而且,如果知识库储备得比较完善,还可以进行分享,便于不同普通投资者之间开展沟通交流、反馈,进而帮助大家拓宽知识视野。
这其实是投资者可以应用和挖掘的两个非常重要的关键要素——大模型对信息的提纲挈领与浓缩输出、基于个人知识库的提炼总结与分享交流,而不只是局限于向DeepSeek提问,询问对市场行情和基本面的看法。
从应用维度来说,大模型对于整个投研工作的效率支撑,存在很多应用场景。
具体应该如何构建实现?王开:向DeepSeek提问时,有几个关键要素。
首先,我们会告诉它角色假设,比如假设你是一位机构投资者,或假设你是一位信息分析人员,这样它就知道具体去找信息、分析信息的维度,是站在什么样的角色上。
第二,最好给它一个案例,比如我们给它哪一年的时点、发生了什么事情,让它按照这个案例进行相应的思考,给它一定的流程和评判的范式。如果是像财务报告或者定期的发布会,每一段其实切割得非常细致,前面可能是三张表,后面可能是附录,哪些数据、哪些信息是比较关键的,在不同的报告之间怎么去对比,把整个的范式固定给它。
然后,我们再告诉它想要的成果究竟是以观点形式输出,还是比如进阶版的,想要提炼定量的数据。像我们提炼特朗普的一些发言观点,这些也是大模型可以辅助加成的工作。
最后再导出时,我们给它一些具体落地的场景,比如它对投资要有实际的借鉴意义,或者对于我们整个辅助决策会有相关参考。
同时,我们在每一步交流的时候,尽可能让它把自己的逻辑在深度思考里体现出来,这样的话,第一,能避免它发生所谓的AI幻象。因为现在信息真的很爆炸,我们从市场上总结的一些信息,要通过大模型去伪存真,保留最真实可信的数据。
比如说,我们去分析一些财务报告或者客观文本时,一般会把温控参数调在0.7的位置,不会让它降到0.4,避免它放飞自我,给出很多AI幻象的问题。同时有的时候,会让它断开联网的检索工具,单独就本地的一些文本或者思路进行相应的分析,并给出最终的输出结果,这样就能避免它夹杂市场上千奇百怪的信息,导致最后的结果受到污染。
如何确保AI投研模型的有效性,筛选优质的数据信息?王开:在分析过程中,分析方法和框架是我们在多年投研体系中积累的。这其实只是通过之前定性的表述,让大模型转化成了定量的方法,并没有摆脱分析师引导的思路。
但唯独担心的是信息源获取问题。比如,我们为了让它在已知“考试答案”的情况下完成“考试过程”,有时会断开联网检索,让它逐期迭代数据,不会一次性给它过多信息。
比如过去20年的数据,不会让它做全样本分析,因为那样它可能会捕捉到未来时间里我们要观测的样本集,或者预测这个时间里的结果。我们会逐期迭代,一个月一个月地来。虽然这种方式可能比较费时间,也比较耗算力,但从整个结果的公允客观性来看,其实是最好的。
本次大师课主要会讲哪些内容?王开:第一点,如果我们能很好地运用大模型,它对于搜集市场投研信息、更精准地辅助投研决策来说,是非常能提质增效的工具。比如网页端以及在线文本端的多维度输入,它能够筛选出比较符合自身认知的投资体系,过滤掉市场噪声,节省很多时间成本。
第二点,以前像机构投资者搭建了一套投研体系后,要不断输入相关数据进行迭代,中间还需要很多辅助加成工作。比如当新的框架在思维范式,以及当前宏观经济逻辑、产业逻辑发生演变时,可能要做逐期调整。而大模型作为工具,已经涵盖了很多模型背后的运算机理,像货币信用体系、美林时钟的库存周期等。它能自动识别哪些体系能为当前资产配置提供最合适、最有意义的指引,并进行动态、定量化的权重分配。这不仅能规避主观性逻辑,还能省去我们花费大量精力去用每一套模型对当时经济情况做相应评判的过程。
第三点,我想最重要的是,能让我们这套面向全市场、类似机构投资的视角更加接地气。比如像您提到的对特朗普言论的跟踪,如果通过量化模型做非常复杂的学术跟踪,确实能达到较好效果,但如果不需要那么高的精准度,只是想了解情绪波动范围,看是变得更乐观还是更悲观,以及对市场信心产生什么样的冲击时,借助大模型,即便牺牲一些精准度,得到一个大致正确的模式,也能让普通投资者使用——将定性的感知转化为量化的数值,进行前后对比,这对于整个资产交易、把握投资的左侧拐点,都有很好的意义。
这门课程对于广大投资者的价值是什么?王开:首先,是如何将大模型工具应用到最优化。因为在课程中我们也会提到,在大模型的应用过程中,怎样才能很好地向DeepSeek提问。其实很多时候,并非大模型的算法、算力有问题,而是我们没有提出一个足够好的问题。我们会结合具体案例,从其背后的逻辑构成、机理出发,再结合具体实践,告诉大家怎么提出比较好的问题,从而得到最高效、最符合自身认知的成果的路径。
其次,我会和大家分享我过去近十年时间里做的一些资产配置框架。我们会在本场大师课分享:这个框架是怎样产生的,当时如何符合经济投资的范式,后来为什么出现迭代(范式迭代的逻辑),哪些指标做了更新(指标的更新),以及现在我们如何为这个体系做统合综效、汇总在一起的评判模式。这些都会嵌套在我们的思维里,它就不只是机械式地进行模型单独辅助的逻辑,而是每一步都能看到我们的思考、理解,以及分析师对整个框架理论的构建。这对于很多投资者构建自己的资产配置体系,其实有很好的借鉴意义。
更多关于如何实操使用DeepSeek进行投研的内容,我会在7月12日上海的大师课中进行分享,感兴趣的朋友,可以点击下方的图片进行报名
课程提纲风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。