与AI共舞,数字化军备竞赛席卷证券研究所

作者: 唐辉俊

证券分析师会不会被人工智能替代?

自从2022年末ChatGPT火爆出圈,人工智能生成内容(AIGeneratedContent,简称“AIGC”)业务为市场所关注,内容从业者未来会被AI替代的预言四起,许多分析师就经常被问及这个话题。

然而至少今天来看,这一时点何时到来还不可见。现实的情形反而是,在国内各大科技厂商AI大模型研发之战正酣之际,从百度的文心一言,到腾讯的混元、阿里的通义千问、华为的盘古……“百模大战”的参与者,各擅哪些胜场,谁会胜出或出局,分析师的观点,颇为市场所重视。

这一结果,或可侧面回答开篇的问题,即人工智能究竟会成为分析师的“平替”,还是分析师乃至券商手里的“金刚钻”。

券商加码信息技术投入

“与初入行的研究员相比,ChatGPT在资料搜索和整合上的效率高,而且可能更具有优势,内容更全面”,但是,由ChatGPT生产的研报,与券商各行业首席分析师输出的研报仍有较大差距,谈论数字化技术对分析师的替代,言之尚早。

财通证券研究所所长李跃博的观点,代表了当下的行业共识。

尽管ChatGPT从1.0进化到4.0,在360创始人周鸿祎看来,其已相当于理工科大学生的水平,但资本市场复杂多变,证券研究考量面广、专业度高,分析师的工作,AI还难以胜任。

虽然人工智能当下不能替代人工,不过,人对人工智能的利用已是一日千里。

分析师利用AI工具辅助研究、撰写公告点评等类型的简式研报,早就不是稀罕事。如今,在拓宽分析师的数据采集面,丰富其信息来源,提升其研究效率,打造投研支持平台等方面,包括AI在内的金融科技应用都展现出了可观的优势和落地速度。

事实上,金融堪称数字化、智能化技术的最佳落地场景之一。研究海内外券商的业务发展趋势可以发现,加大信息技术投入,加快金融与科技融合,增强智能投资与研究方面的竞争优势,深受业界重视。

仅从2022年上市券商已披露的信息技术投入来看,国内大中型券商中,华泰证券、中金公司、海通证券、招商证券、广发证券、国金证券的投入增幅均超过20%。其中,华泰证券投入达到27.24亿元,金额居行业第一;中金公司投入19.06亿元,金额上居第二,但增幅达44.83%,居于首位(附表)。

巨量投入,推动中国证券行业走向智能、高效发展之路,这也体现在分析师的日常工作中。

常规数据:爬虫挖掘与大数据技术加持,信息收集快、宽、细、准

数据是研报的基石,技术与研究的碰撞,最先改变的是分析师的数据获取效率和质量。

传统投研工作中,卖方分析师通常需要长期跟踪所研究的公司或行业,通过公司披露信息、实地调研等渠道,收集各类数据、信息;此后,依靠行业知识储备和历史经验,对数据进行加工整合;通过数理建模,展开预测;基于研究框架下的逻辑分析,形成观点,最终以报告的形式输出;同时,还要根据行业和市场的变化,对观点进行动态调整。

这一过程,对分析师的信息搜集、数据处理、逻辑分析和知识结构都提出了较高的要求,且耗费的时间成本不低。其中,数据收集是分析师工作的起点,其速度和质量,一定程度影响研究的速度和质量。

分析师需要收集的数据中,除了上市公司公告、交易数据、宏观数据、行业数据等常规数据外,如果能快速收集到一些更为精细、深入的差异化数据,更有助于研究判断。

然而,在一些行业,碎片化和多源、异构的数据体系,往往为研究平添困难。此时,通过调研、电话会议等渠道深入挖掘各类信息,成为分析师的核心竞争力之一。比如早年,一个分析师要想知道航空运输数据,需要打电话去各个旅行社了解情况,谁能找到更多的旅行社,谁就拥有更多的信息优势。

2022年部分券商信息技术投入金额

与AI共舞,数字化军备竞赛席卷证券研究所0
数据来源:Wind、公司财报,新财富整理

而在数字技术的加持下,分析师不仅可以加快信息获取速度,拓宽信息面,数据的多元化以及精细化程度也大大加深。例如,爬虫技术的应用,可以通过模拟浏览器行为,自动化地从网页上抓取所需数据,极大地减轻人工操作的负担,让分析师获取大量颗粒度更细甚至意想不到的数据。

与此同时,通过大数据技术,分析师可以对收集的数据进行清洗和处理,探索其中的潜在规律,从而做出更准确且深度的判断。

结构化、模型化的处理使得金融市场大量原始数据的效用和价值得以提升。工作效率上,计算机在数据处理、模型搭建方面的速度也明显超过人工,并可以避免因分析师个人水平、偏好、经验甚至情绪的不同而影响数据分析的结果。

因此,越来越多的金融机构在搭建智能投研平台时,重心之一即在于数据收集与处理,以探索“研究+数据”相结合的方式,提升研究质量。

譬如,东证期货推出的由大数据平台、人工智能、移动互联等技术所构建的智能投研平台“繁微”,即在引入数据可视化、流程化管理、人工智能等模块的基础上,将传统投研的各个环节优化升级,解放需耗费大量人工的基础投研数据搜集整理工作。

根据官方信息,在数据源的选择上,“繁微”结合了资深分析师在衍生品研究上的经验,从市场认可度、数据质量、数据稳定性等维度挑选对接数据商,并根据不同期货品种的研究框架,梳理成易于查询和使用的数据目录和图表。

与AI共舞,数字化军备竞赛席卷证券研究所1

而在技术上,针对梳理海量来源不同的数据要耗费大量精力,数据处理工作重复繁杂造成人力资源浪费,以及数据存储分散造成数据孤岛等一系列问题,“繁微”的ETL(数据仓库技术,是指将业务系统的数据经过抽取、清洗转换之后,加载到数据仓库)工具和数据集成平台,可以帮助解决格式转换、数据标准化、数据合并等问题,使数据更易于整合和分析,帮助研究员管理数据,支持其进行数据分析、建模等,助力研究效率提升。

目前,“繁微”平台的数据指标覆盖了超过60个商品/金融期货/期权,已完成清洗可直接使用的指标量达2万多条,形成标准的模板图表达3000多个,研究员可随时调用进行数据加工研究,或跟踪图表内数据更新情况,提升工作效率和准确性。

东证期货表示,在数据采集与整合方面,未来其将继续对数据的来源进行拓展和深挖,利用数据挖掘和自然语言处理,自动化数据采集和整合过程,提高数据采集、清洗的效率;在数据分析与建模方面,使用机器学习、深度学习等技术,进行数据分析和建模。此外,针对非结构化的数据(如舆情资讯),进行自动化打标和情感分析,识别投资机会和风险,给出建议和预测,减少投资决策时间、降低风险。

另类数据:分析师必备新技能,成就差异化研究

常规数据之外,一些另类数据,比如产业链数据、政策与舆情数据、卫星图片、天气数据等,亦开始成为分析师重要的信息来源。

美国的OrbitalInsight(轨道洞察)是一家通过分析卫星图像来获取和售卖数据的初创公司。据官网介绍,其在2019年推出了GO地理空间分析平台,通过提供融合了人工智能、卫星图像、合成孔径雷达(SAR)、自动识别系统(AIS)和物联网(IoT)设备的数据源,为分析人员提供支持。

其创始人詹姆斯·克劳福德(JamesCrawford)发现,通过卫星图观察不同地区在建建筑影子的变化,可以分析出建筑行业是处于繁荣上升还是萧条下降期;通过分析停车场的数据,可以预测沃尔玛、家得宝等零售商的季度销售情况。一个典型案例是,其基于对罗斯百货(RossStores)停车场的历史数据分析,预测其季度销售额会好于预期,这一结果甚至优于同期分析师的普遍预测值。据称,目前该公司的首批用户已包括几家资管规模几十亿美元的对冲基金。

像这样的另类数据分析手段,亦被逐渐引入卖方研究领域。

大型投行摩根士丹利同样试图依靠数字手段获取的非标准化数据来了解市场。其量化和衍生品策略全球主管马克·科拉诺维奇(MarkoKolanovic)曾通过电子邮件表示,“我们跟踪新病例和住院的统计数据,可以更好地了解病毒的性质”。

“财务数据以外的数据不仅是有趣的,还将成为研究的核心组成部分。”瑞银证券研究与分析部组长胡安·路易斯·佩雷斯(JuanLuisPerez)表示。

早在2014年,瑞银便成立了瑞银实证所(UBSEvidenceLab)。其独立于瑞银研究的专家团队,每月会收集、清理数十亿个数据项目并运用多种工具及技巧,将数据转化为实证,以建立深度数据库。瑞银实证所创新业务全球总监巴里·赫雷维茨(BarryHurewitz)表示:“瑞银实证所拥有超过100个不同的框架,以及大约55个不同的实验室。”其相关资产库涵盖各地区、行业的超过4000家公司。

瑞银会在研报中广泛使用瑞银实证所的独有数据,这些数据被认为能够辅助分析师们撰写具有差异化视角的深度研究,以加强瑞银的影响力。瑞银实证所每年也会基于另类数据和分析,发布约3000份策略研究报告。

数据驱动式研究为分析师提供了更多工具,当然,数据的多元化也给他们提出了新的要求,学习并利用这些新型数据,成为其必备技能。瑞银便部署了一个由数据分析师、机器学习专家等组成的团队,帮助分析师更好地使用数据。

与此同时,瑞银也会通过技术手段了解市场关注点,其产品Q-series正致力于此⸺它会每天在全网搜集客户最关注的问题,反馈给研究部门,并产出研究结果。瑞银证券董事总经理、研究部总监连沛堃曾表示:“通过这种方式研究出来的成果一定是客户最感兴趣、最想了解的,这样,客户也肯定会读我们的报告。这还能吸引他们购买我们报告背后的专家咨询和关键数据。”

连沛堃表示,瑞银还将通过AI对数据进行处理,帮助客户深度开发数据,瑞银希望将自己打造成一家研报产品差异化、数据系统化、跟踪行业有持续性的卖方研究机构。

欧美之外,中国分析师同样关注另类数据的应用。

清华大学金融科技研究院证券科技研究中心早在2020年针对分析师的一项调研结果便显示,分析师关注如何借助数字科技,在数据集采、足迹分析、地理空间分析、定量研究等方面引入新式调查研究手段,从多重角度获取有帮助的数据和信息。

天风证券副总裁、研究所所长赵晓光在接受新财富采访时曾表示,目前天风证券研究所已组建专门的数据研究团队⸺天风数据研究院,而产业链数据则成为重要的数据来源。赵晓光介绍,除传统的财务数据外,天风数据研究团队会对各产业的数据进行挖掘与梳理,帮助分析师进行信息加工,提升研究效率。

事实上,在传统的基本面研究方法的基础上,叠加大量另类数据,结合人工智能技术的使用,主要包括知识图谱、自然语言处理等,能使分析师们对投资机会及方向的挖掘进一步智能化。

具体来看,基于深度学习的自然语言处理技术,包含信息抽取与文本匹配两个方面。信息抽取,一般是指从非结构化文本中,抽取机器或程序能够理解的结构化知识。譬如,从政策信息、新闻舆情信息中,抽取关键内容构成另类数据,同时,针对单条的政策信息,可以采用文本匹配的方法来统计报道相关政策的新闻数量,以此量化政策发布后的热度,帮助分析师们更好地进行判断,提升工作效率。

而知识图谱提出之初,旨在实现更智能的搜索引擎。知识图谱能够将互联网上的信息、数据以及链接关系聚集为知识,使信息资源更易于计算、理解以及评价。通俗来讲,知识图谱是由节点和关系所组成的图谱,为真实世界各个场景的直观建模。通过不同知识的关联性形成一个网状的知识结构,看起来就如同一张图谱。构建知识图谱的过程在于让机器拥有认知能力,从而更好地理解世界。

上一篇 点击页面呼出菜单 下一篇