投研应用从人力密集到 AI 增强


如果把传统卖方 / 买方研究比喻成「人力堆出来的情报工厂」,那么近几年 AI 带来的,就是一次从地基到产线的全面改造。过去,一份行业深度报告往往意味著几个分析师通宵读财报、抄数字、听电话会议、剪新闻剪访谈;今天,同样的流程里,越来越多重复性工作被 AI 接手,人类分析师转向「问更好的问题」「做更难的判断」。

根据 Mercer 2024 年对资产管理机构的调查,约 91% 的资产管理人已经在使用,或计划在投资策略与资产类别研究中使用 AI,其中 54% 已经实际落地,37% 正在规画导入。另一份 2024 年针对基金经理的调查显示,超过 80% 的基金公司已在某种程度上使用 AI,约 69% 将 AI 作为投资研究工具,44% 更已将 AI 纳入投资决策流程。这些数字背后反映的是一个关键事实:金融研究正在从人力密集走向 AI 增强(AI-augmented),而不是「人类被机器取代」那么简单。

从人海战术到 AI 研究助手

在过去很长一段时间里,投研团队的竞争力,很大程度取决于「能招多少人、愿意熬多少夜」。数百页的年报、季报,动辄两小时的业绩会议,还有各类行业数据、新闻、社交媒体与第三方报告,都要靠分析师一篇篇阅读、一个个表格手工整理。这样的工作模式有几个问题:第一,信息溢出。可读的东西太多,可用的时间太少,必然导致很多公司、很多地区被「研究空白」所覆盖;第二,人力昂贵。请一位有经验的分析师不便宜,却有相当比例时间花在「搬砖」而非思考;第三,速度不够快。在高频信息冲击下,等到人读完、抄完、消化完,市场可能早已完成了一轮定价。

AI 的引入,首先改变的就是这三点。以生成式 AI 为代表的新一代工具,能在秒级扫描大量文本、结构化数据与多媒体内容,初步整理出重点、亮点与风险点,并根据既定模板生成初稿。这并不意味著分析师可以「躺平」,而是研究流程被拆解为两层:底层是 AI 负责的自动化信息收集、清洗、标注与初步分析;上层则是分析师基于 AI 产出的素材进行假设构建、情境推演与投资决策。

同时,AI 也让投研「覆盖面」大幅提升。传统上,小市值公司、冷门行业和新兴市场,往往因为不「划算」而缺乏深入覆盖;当大量基础分析工作可以自动完成后,研究团队更容易在边缘领域布局,寻找被忽视的错价与机会。对机构投资者而言,这种「广度+深度」的提升,是 AI 增强的直接红利。

自动化财报分析已落地

在所有应用场景中,自动化财报分析几乎是最自然、也是最容易落地的一块。原因很简单:财报高度结构化,但格式又各有不同,非常适合由机器来做标准化处理。

现代 AI 系统可以直接读取 PDF、XBRL 或网页形式的年报、季报与公告,透过 OCR 结合结构化解析,将财务三表、附注、分部信息与关键指标自动提取出来,并映射到统一的数据库结构之中。接著,模型可以自动计算常见财务比率(如 ROE、毛利率、净利率、资产周转率、杠杆倍数等),并将这些指标放在历史序列与同业比较的框架下进行评估:当前毛利率是否显著偏离过去五年区间?营运现金流与净利的偏差是否异常?存货和应收账款是否出现「双升」预警?

更进一步的应用,是利用机器学习做「异常检测」。在足够大的样本下,模型可以学习一家公司在不同景气阶段的「正常财务行为」模式,一旦新报表出现与既有模式明显不一致的情况(例如收入增速大幅飙升,但现金流并未跟上;或费用率突然出现「整齐」下滑),系统便会自动标记为「需要人工关注的点」。这类工具对于识别财务风险、会计调整甚至潜在造假,都有一定辅助价值。

当然,AI 并不能取代专业的会计判断。例如会计政策变更、一次性资产减值、并购重组等事件往往需要结合管理层披露与行业背景才能正确理解。AI 在这里扮演的,更像是一位「极度勤奋、不会疲劳的高级研究助理」:它可以帮你把十年财报、数十家公司、上百个指标全部算好、画图好,但怎么解读这些数字,仍然需要人类分析师结合理论、经验与直觉来做最后判断。

非结构化文字变成可回测的数据

如果说财报是「结构化数字的世界」,那么投资研究中更棘手的,其实是大量非结构化文本:董事会声明、管理层讨论与分析(MD&A)、业绩会议纪要、券商报告、新闻稿、监管文件,乃至社交媒体与论坛上的讨论。这些内容往往包含最关键的前瞻信息与语气变化,但过去很难被系统化利用。自然语言处理(NLP)的进步,正在改变这一点。

一方面,NLP 可以对文本做语意理解与标注,将文本拆解为可以量化和统计的特征。例如,对公司业绩会议纪要进行情绪分析,衡量管理层在谈及收入、成本、需求、竞争时使用正向或负向词语的频率和强度,并追踪这些情绪指标与未来盈利表现之间的关联。已有学术研究利用 NLP 对对冲基金经理的评论文本构建「基金情绪指标」,发现情绪变化与基金收益和景气循环之间存在显著关联。

另一方面,NLP 也让「跨语言研究」变得更可行。以前,全球投资者要覆盖多个语言市场,需要配置不同语言背景的分析师,如今,多语言大模型可以在同一框架下处理中文、英文、日文等文本,将其统一投射到共同的语意空间。这意味著,投资机构在做跨市场比较时,能够用相似标准对不同语言的公司披露与新闻内容进行打分与排序,降低了语言壁垒。

更重要的是,NLP 与「替代数据」(alternative data)的结合,使得原本难以利用的资讯来源成为可回测的因子。根据机构调查,大约 50% 的机构投资者认为 NLP 与情绪相关数据,是未来最具潜在超额收益的替代数据类型之一。这不仅包括传统财经新闻的语气分析,也涵盖社交媒体「声量」、企业招聘广告文本、产品评论甚至政策文件的措辞变化。对量化研究者而言,这些曾经被称为「软信息」的内容,如今可以被转化为可量化、可回测的硬指标。

在 AI 加持下,市场情绪这一过去颇为抽象的概念,正在被数据化和商品化。以往,「情绪」更多体现在市场参与者的语言和行为之中——媒体报导偏多还是偏空?社交平台上对某公司是赞多还是骂多?期权市场的隐含波动率是恐慌还是贪婪?如今,这些维度都可以透过 AI 模型实时计算出数值。

对冲基金和量化机构是这方面的先锋。最新报导显示,对冲基金每年在替代数据上的投入已达数十亿美元,从交易凭证到卫星影像、从电商销售到 App 使用数据,无所不包,其中一大类就是各种基于 NLP 和社交数据的情绪指标。对於单一股票,可以计算「新闻情绪指标」与「社交情绪指标」,并观察它们与短期股价波动、中期风险溢酬之间的关系;对于整个市场或行业,则可以构建「风险厌恶指数」或「政策不确定性指数」,用来辅助资产配置决策。

这些情绪指标常见的应用包括:作为事件驱动策略的触发条件(例如当新闻情绪极度偏空但基本面尚无明显恶化时,考虑反向建仓);作为风险管理工具(在情绪极端时减仓,避免成为「最后一个买单 / 卖单」);以及作为传统因子(估值、成长、品质、动能)之外的补充维度,用以解释短期「偏离基本面」的市场行为。更高阶的应用,则是把情绪时序与宏观变量结合,捕捉景气循环与政策预期变化。

但情绪数据也有其局限。首先,文本本身就存在噪音和偏见,例如讽刺、反语难以被机器准确捕捉;其次,资料来源本身可能偏向某一族群或平台,未必能代表整体市场;再者,当某些情绪指标被广泛使用后,市场可能出现「自我实现」或「自我否定」的动态——大家都知道「恐慌指数」高了要买,于是恐慌还没来就先涨一波,原有规律被套利掉。因此,成熟的机构往往不会把情绪指标当作单一决策依据,而是纳入更大的多因子框架,并持续做稳健性检验。

AI 增强而非AI 取代

从自动化财报分析,到 NLP 理解文本、构建情绪指标,AI 已经深度嵌入投资研究流程。根据多份行业调查,如今逾七成至九成的资产管理机构,已在不同程度上引入 AI 支援研究、风控或投资决策。但与其说这是一场「人与机器的零和博弈」,不如说是研究部门的工作分工从此被重新定义——机器负责大规模、重复且讲究一致性的工作,人类则把有限的认知资源投入到难以自动化的任务:理解结构性变局、捕捉制度与文化差异、与企业管理层深度互动,以及在不确定性之下做出平衡风险与回报的最终决策。

当然,AI 在投研中的应用也带来新的风险与监管议题:数据隐私与合规、模型偏见与「黑箱」、过度依赖历史数据导致在 regime shift 中失灵,乃至生成式 AI 可能出现的「幻觉」与错误引用。未来几年,负责任的资产管理机构,很可能需要建立专门的 AI 治理框架,从数据来源、模型验证到人机协作边界,都给出明确规则。

金融研究从来不是一门「算公式就好」的行业,而是一门结合数据、故事与人性的综合艺术。AI 的加入,让数据和故事的部分更高效、更全面,却也把对人性的考验推向新的高度——在充满模型与指标的世界里,谁还记得自己为何出发、风险承受度在哪里、以及什么才是真正的长期价值。那些能既善用 AI、又保持独立思考的投资人,才最有机会在下一轮市场循环中,真正把这场技术变革的红利收入囊中。

内容支持: 华通证券国际(WTF.US)  



$SoFi Technologies Inc.(SOFI)$  ‌‌$PayPal(PYPL)$  ‌‌$Palantir Technologies Inc.(PLTR)$  ‌$HKEX(00388)$  ‌‌$Futu Holdings Limited(FUTU)$  ‌‌$Tiger Brokers(TIGR)$  ‌‌‌

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论